Il y a plus de trois décennies, Red Hat a vu le potentiel du développement et des licences open source pour créer de meilleurs logiciels et favoriser l'innovation informatique. Après trente millions de lignes de code, Linux n'a pas seulement évolué pour devenir le logiciel open source le plus réussi, mais il conserve également cette position jusqu'à aujourd'hui. L'engagement envers les principes open source continue, non seulement dans le modèle d'affaires d'entreprise, mais aussi en tant que partie intégrante de la culture de travail. Dans l'évaluation de l'entreprise, ces concepts ont le même impact sur l'intelligence artificielle (IA) s'ils sont réalisés de la bonne manière, mais le monde de la technologie est divisé quant à ce qui constituerait la « bonne manière ».
L'IA, en particulier les grands modèles de langage (LLMs) derrière l'IA générative (gen AI), ne peut pas être considérée de la même manière qu'un programme ouvert. Contrairement au logiciel, les modèles d'IA consistent principalement en des modèles de paramètres numériques qui déterminent comment un modèle traite les entrées, ainsi que la connexion qu'il établit entre plusieurs points de données. Les paramètres des modèles entraînés sont le résultat d'un long processus impliquant de vastes quantités de données d'entraînement qui sont soigneusement préparées, mélangées et traitées.
Bien que les paramètres du modèle ne soient pas un logiciel, ils ont dans certains aspects une fonction similaire au code. Il est facile de faire la comparaison selon laquelle les données sont le code source du modèle, ou qu'elles en sont très proches. Dans le code source open source, le code source est communément défini comme la « forme préférée » pour apporter des modifications au logiciel. Les données d'entraînement seules ne suffisent pas à cette fonction, étant donné leur taille différente et leur processus de pré-entraînement complexe qui aboutit à une connexion ténue et indirecte entre tout élément des données utilisées lors de l'entraînement, les paramètres entraînés et le comportement résultant du modèle.
La plupart des améliorations et des améliorations des modèles d'IA qui se produisent actuellement dans la communauté n'impliquent pas l'accès ou la manipulation des données d'entraînement originales. Au lieu de cela, ils sont le résultat de modifications des paramètres du modèle ou d'un processus ou ajustement qui peut également servir à ajuster la performance du modèle. La liberté d'apporter ces améliorations au modèle exige que les paramètres soient publiés avec toutes les permissions que les utilisateurs reçoivent sous des licences open source.
La vision de Red Hat pour l'IA open source.
Red Hat croit que la base de l'IA open source se trouve dans lesparamètres de modèle licenciés en open source combinés avec des composants de logiciel open sourceCeci est un point de départ pour l'IA open source, mais ce n'est pas la destination finale de la philosophie. Red Hat encourage la communauté open source, les autorités réglementaires et l'industrie à continuer à s'efforcer d'obtenir une plus grande transparence et un alignement avec les principes du développement open source en formant et en ajustant des modèles d'IA.
Voici la vision de Red Hat en tant qu'entreprise, qui englobe un écosystème de logiciels open source, permettant une interaction concrète avec l'IA open source. Ce n'est pas une tentative de définition formelle, comme celle que laInitiative Open Source(OSI) est en train de développer avec saDéfinition de l'IA open source(OSAID). C'est le point de vue de la corporation qui rend l'IA open source réalisable et accessible au plus grand nombre de communautés, d'organisations et de fournisseurs.
Ce point de vue en pratique est mis en œuvre à travers le travail avec les communautés open source, mis en avant par le projetInstructLab, dirigé par Red Hat et l'effort avec IBM Researchdans la famille Granite de modèles open source sous licenceO InstructLab reduz significativamente as barreiras para que pessoas que não são cientistas de dados contribuam com modelos de IA. Avec InstructLab, les spécialistes de tous les secteurs peuvent ajouter leurs compétences et connaissances, tant pour un usage interne que pour aider un modèle d'IA open source partagé et largement accessible aux communautés en amont.
La famille de modèles Granite 3.0 couvre une large gamme de cas d'utilisation de l'IA, allant de la génération de code au traitement du langage naturel pour extraireaperçusde grandes ensembles de données, tout sous une licence open source permissive. Nous avons aidé IBM Research à rendre la famille de modèles Granite open source et continuons à soutenir cette famille de modèles, tant du point de vue open source que dans le cadre de notre offre Red Hat AI.
La répercussion desannonces récents de DeepSeekmontre comment l'innovation open source peut impacter l'IA, tant au niveau du modèle qu'au-delà. Il y a évidemment des préoccupations concernant l'approche de la plateforme chinoise, notamment le fait que la licence du modèle n'explique pas comment il a été produit, ce qui renforce la nécessité de transparence. Cela dit, la disruption mentionnée renforce la vision de Red Hat sur l'avenir de l'IA : un futur ouvert, axé sur des modèles plus petits, optimisés et ouverts, pouvant être personnalisés pour des cas d'utilisation de données d'entreprise spécifiques partout dans le cloud hybride.
Élargir les modèles d'IA au-delà de l'open source
Le travail de Red Hat dans le domaine de l'IA open source va bien au-delà d'InstructLab et de la famille de modèles Granite, englobant les outils et plateformes nécessaires pour réellement consommer et utiliser de manière productive l'IA. L'entreprise est devenue très active dans la promotion de projets et de communautés technologiques, comme par exemple (mais pas uniquement) :
● RamaLama, un projet open source visant à faciliter la gestion et la mise à disposition locale de modèles d'IA ;
● TrustyAI, un kit d'outils open source pour la construction de flux de travail d'IA plus responsables ;
● Climatik, un projet axé sur la rendre l'IA plus durable en ce qui concerne la consommation d'énergie ;
● Laboratoire d'IA Podmanune boîte à outils pour développeurs axée sur la facilitation de l'expérimentation avec des LLM open source ;
Leannonce récentesur Neural Magic élargit la vision d'entreprise sur l'IA, permettant aux organisations d'aligner des modèles d'IA plus petits et optimisés, y compris des systèmes open source sous licence, avec leurs données, où qu'elles se trouvent dans le cloud hybride. Les organisations informatiques peuvent alors utiliser le serveur d'inférence.vLLMpour stimuler les décisions et la production de ces modèles, en aidant à construire une pile d'IA basée sur des technologies transparentes et avec un support.
Pour la corporation, l'IA open source vit et respire dans le cloud hybride. Le cloud hybride offre la flexibilité nécessaire pour choisir le meilleur environnement pour chaque charge de travail en IA, en optimisant la performance, le coût, l'échelle et les exigences de sécurité. Les plateformes, objectifs et organisation de Red Hat soutiennent ces efforts, en collaboration avec des partenaires du secteur, des clients et la communauté open source, à mesure que le code ouvert dans l'intelligence artificielle est encouragé.
Il existe un immense potentiel pour élargir cette collaboration ouverte dans le domaine de l'IA. Red Hat envisage un avenir où le travail transparent dans les modèles, ainsi que leur formation, sont intégrés. Que seja na próxima semana ou no próximo mês (ou até antes, dada a rapidez da evolução da IA), a empresa e a comunidade aberta, como um todo, continuarão a apoiar e adotar os esforços para democratizar e abrir o mundo da IA.