Fa més de tres dècades, Red Hat va veure el potencial del desenvolupament i les llicències de codi obert per crear un millor programari i fomentar la innovació informàtica. Trenta milions de línies de codi després, Linux no només s'ha desenvolupat fins a convertir-se en el programari de codi obert més reeixit, sinó que també manté aquesta posició fins avui. El compromís amb els principis del codi obert continua, no només en el model de negoci corporatiu, sinó també com a part de la cultura laboral. Segons l'avaluació de l'empresa, aquests conceptes tenen el mateix impacte en la intel·ligència artificial (IA) si es fan correctament, però el món tecnològic està dividit sobre quin seria el "camí correcte".
La IA, especialment els models de llenguatge gran (LLM) que hi ha darrere de la IA generativa (IA genèrica), no es poden veure de la mateixa manera que un programa de codi obert. A diferència del programari, els models d'IA consisteixen principalment en models de paràmetres numèrics que determinen com un model processa les entrades, així com la connexió que estableix entre diversos punts de dades. Els paràmetres dels models entrenats són el resultat d'un llarg procés que implica grans quantitats de dades d'entrenament que es preparen, barregen i processen acuradament.
Tot i que els paràmetres del model no són programari, en alguns aspectes tenen una funció similar al codi. És fàcil comparar les dades amb el codi font del model o alguna cosa molt semblant. En codi obert, el codi font es defineix habitualment com la "manera preferida" de fer modificacions al programari. Les dades d'entrenament per si soles no s'adapten a aquesta funció, atesa la seva mida variable i el complicat procés de preentrenament que resulta en una connexió tènue i indirecta que qualsevol element de dades utilitzat en l'entrenament té amb els paràmetres entrenats i el comportament resultant del model.
La majoria de les millores i millores als models d'IA que actualment es produeixen a la comunitat no impliquen accedir o manipular les dades d'entrenament originals. En canvi, resulten de modificacions als paràmetres del model o d'un procés o ajustament que també pot servir per ajustar el rendiment del model. La llibertat de fer aquestes millores al model requereix que els paràmetres es publiquin amb tots els permisos que els usuaris reben sota llicències de codi obert.
La visió de Red Hat per a la IA de codi obert.
Red Hat creu que la base de la IA de codi obert rau en els paràmetres del model amb llicència de codi obert combinats amb components de programari de codi obert . Aquest és un punt de partida per a la IA de codi obert, però no la destinació final de la filosofia. Red Hat anima la comunitat de codi obert, les autoritats reguladores i la indústria a continuar esforçant-se per una major transparència i alineació amb els principis de desenvolupament de codi obert a l'hora d'entrenar i ajustar els models d'IA.
Aquesta és la visió de Red Hat com a empresa que engloba un ecosistema de programari de codi obert i que pot interactuar pràcticament amb la IA de codi obert. No és un intent de definició formal, com la que l' Open Source Initiative (OSI) està desenvolupant amb la seva Open Source AI Definition (OSAID). Aquesta és la perspectiva de la corporació sobre com fer que la IA de codi obert sigui factible i accessible a la gamma més àmplia possible de comunitats, organitzacions i proveïdors.
Aquesta perspectiva es posa en pràctica mitjançant el treball amb comunitats de codi obert, destacat pel InstructLab , liderat per Red Hat, i l'esforç amb IBM Research sobre la família Granite de models de codi obert amb llicència . InstructLab redueix significativament les barreres perquè els no científics de dades contribueixin amb models d'IA. Amb InstructLab, experts en dominis de tots els sectors poden afegir les seves habilitats i coneixements, tant per a ús intern com per ajudar a crear un model d'IA de codi obert compartit i àmpliament accessible per a les comunitats aigües amunt.
La família de models Granite 3.0 aborda una àmplia gamma de casos d'ús d'IA, des de la generació de codi fins al processament del llenguatge natural i l'extracció d'informació de grans conjunts de dades, tot sota una llicència de codi obert permissiva. Vam ajudar IBM Research a portar la família de models de codi Granite al món del codi obert i continuem donant suport a la família de models, tant des d'una perspectiva de codi obert com com a part de la nostra oferta d'IA de Red Hat.
Les repercussions dels anuncis recents de DeepSeek mostren com la innovació de codi obert pot afectar la IA, tant a nivell de model com més enllà. Òbviament, hi ha preocupacions sobre l'enfocament de la plataforma xinesa, en particular que la llicència del model no explica com es va produir, cosa que reforça la necessitat de transparència. Dit això, la disrupció esmentada reforça la visió de Red Hat per al futur de la IA: un futur obert centrat en models més petits, optimitzats i oberts que es poden personalitzar per a casos d'ús específics de dades empresarials en qualsevol ubicació dins del núvol híbrid.
Expansió dels models d'IA més enllà del codi obert.
La feina de Red Hat en l'espai de la IA de codi obert va molt més enllà d'InstructLab i la família de models Granite, i s'estén a les eines i plataformes necessàries per consumir i utilitzar la IA de manera productiva. L'empresa s'ha tornat molt activa en el foment de projectes i comunitats tecnològiques, com ara (entre d'altres):
● RamaLama , un projecte de codi obert que té com a objectiu facilitar la gestió local i el desplegament de models d'IA;
● TrustyAI , un conjunt d'eines de codi obert per crear fluxos de treball d'IA més responsables;
● Climatik , un projecte centrat en ajudar a fer que la IA sigui més sostenible pel que fa al consum d'energia;
● Podman AI Lab , un conjunt d'eines per a desenvolupadors centrat en facilitar l'experimentació amb LLM de codi obert;
El recent anunci sobre Neural Magic amplia la visió corporativa de la IA, permetent que les organitzacions alineïn models d'IA més petits i optimitzats, inclosos sistemes de codi obert amb llicència, amb les seves dades, independentment d'on resideixin al núvol híbrid. Les organitzacions de TI poden utilitzar el vLLM per impulsar les decisions i la producció a partir d'aquests models, ajudant a construir una pila d'IA basada en tecnologies transparents i compatibles.
Per a la corporació, la IA de codi obert viu i respira al núvol híbrid. El núvol híbrid proporciona la flexibilitat necessària per triar el millor entorn per a cada càrrega de treball d'IA, optimitzant el rendiment, el cost, l'escalabilitat i els requisits de seguretat. Les plataformes, els objectius i l'organització de Red Hat donen suport a aquests esforços, juntament amb els socis de la indústria, els clients i la comunitat de codi obert, a mesura que el codi obert en intel·ligència artificial s'impulsa cap endavant.
Hi ha un potencial immens per expandir aquesta col·laboració oberta en l'espai de la IA. Red Hat preveu un futur que inclogui el treball transparent en models, així com el seu entrenament. Ja sigui la setmana vinent o el mes vinent (o fins i tot abans, donada la ràpida evolució de la IA), l'empresa i la comunitat oberta en conjunt continuaran donant suport i abraçant els esforços per democratitzar i obrir el món de la IA.

