Hace más de tres décadas, Red Hat vio el potencial del desarrollo y las licencias de código abierto para crear mejores softwares y fomentar la innovación en TI. Treinta millones de líneas de código después, Linux no solo se desarrolló hasta convertirse en el software de código abierto más exitoso, sino que también mantiene esa posición hasta hoy. El compromiso con los principios de código abierto continúa, no solo en el modelo de negocio corporativo, sino también como parte de la cultura laboral. En la evaluación de la empresa, estos conceptos tienen el mismo impacto en la inteligencia artificial (IA) si se hacen de la manera correcta, pero el mundo de la tecnología está dividido en cuanto a cuál sería la "manera correcta".
La IA, en especial los grandes modelos de lenguaje (LLMs) detrás de la IA generativa (gen AI), no puede ser vista de la misma manera que un programa abierto. A diferencia del software, los modelos de IA consisten principalmente en modelos de parámetros numéricos que determinan cómo un modelo procesa entradas, así como la conexión que hace entre varios puntos de datos. Los parámetros de los modelos entrenados son el resultado de un largo proceso que involucra grandes cantidades de datos de entrenamiento que son cuidadosamente preparados, mezclados y procesados.
Aunque los parámetros del modelo no son software, en algunos aspectos tienen una función similar al código. Es fácil hacer la comparación de que los datos son el código fuente del modelo, o estarían muy cerca de él. En código abierto, el código fuente se define comúnmente como la "forma preferida" para hacer modificaciones en el software. Los datos de entrenamiento por sí solos no encajan en esta función, ya que su tamaño difiere y por su complicado proceso de preentrenamiento que resulta en una conexión tenue e indirecta entre cualquier elemento de los datos utilizados en el entrenamiento, los parámetros entrenados y el comportamiento resultante del modelo.
La mayoría de las mejoras y avances en modelos de IA que están ocurriendo ahora en la comunidad no implican acceso o manipulación de los datos originales de entrenamiento. En cambio, son el resultado de modificaciones en los parámetros del modelo o en un proceso o ajuste que también puede servir para ajustar el rendimiento del modelo. La libertad de realizar esas mejoras en el modelo requiere que los parámetros se publiquen con todos los permisos que los usuarios reciben bajo licencias de código abierto.
Visión de Red Hat para la IA de código abierto.
Red Hat cree que la base de la IA de código abierto se encuentra en losparámetros de modelo licenciados de forma open source combinados con componentes de software open sourceEste es un punto de partida de la IA de código abierto, pero no el destino final de la filosofía. Red Hat fomenta a la comunidad de código abierto, a las autoridades regulatorias y a la industria a seguir esforzándose por lograr mayor transparencia y alineación con los principios del desarrollo de código abierto al entrenar y ajustar modelos de IA.
Esta es la visión de Red Hat como empresa, que abarca un ecosistema de software de código abierto, puede involucrarse de manera práctica con la IA de código abierto. No es un intento de definición formal, como la que laIniciativa de Código Abierto(OSI) está desarrollando con suDefinición de IA de Código Abierto(OSAID). Este es el punto de vista de la corporación que hace que la IA de código abierto sea factible y accesible para el mayor conjunto de comunidades, organizaciones y proveedores.
Este punto de vista en la práctica se pone en práctica a través del trabajo con las comunidades de código abierto, destacado por el proyectoInstructLab, liderado por Red Hat y del esfuerzo con IBM Researchen la familia Granite de modelos de código abierto licenciadosEl InstructLab reduce significativamente las barreras para que personas que no son científicos de datos contribuyan con modelos de IA. Con InstructLab, especialistas en dominio de todos los sectores pueden agregar sus habilidades y conocimientos, tanto para uso interno como para ayudar a un modelo de IA de código abierto compartido y ampliamente accesible para comunidades upstream.
La familia de modelos Granite 3.0 abarca una amplia gama de casos de uso de IA, desde generación de código hasta procesamiento de lenguaje natural para extraerperspectivasgrandes conjuntos de datos, todo bajo una licencia open source permisiva. Ayudamos a IBM Research a llevar la familia de modelos de código Granite al mundo open source y seguimos brindando soporte a la familia de modelos, tanto desde el punto de vista open source como parte de nuestra oferta Red Hat AI.
La repercusión de losanuncios recientes de DeepSeekmuestra cómo la innovación de código abierto puede impactar la IA, tanto a nivel del modelo como más allá. Obviamente hay preocupaciones sobre el enfoque de la plataforma china, principalmente que la licencia del modelo no explica cómo fue producido, lo que refuerza la necesidad de transparencia. Dicho esto, la disrupción mencionada refuerza la visión de Red Hat sobre el futuro de la IA: un futuro abierto, centrado en modelos más pequeños, optimizados y abiertos, que pueden ser personalizados para casos de uso de datos empresariales específicos en cualquier lugar de la nube híbrida.
Expandiendo modelos de IA más allá del código abierto
El trabajo de Red Hat en el espacio de la IA de código abierto va mucho más allá de InstructLab y la familia de modelos Granite, llegando hasta las herramientas y plataformas necesarias para consumir y usar la IA de manera productiva. La empresa se volvió muy activa en el fomento de proyectos y comunidades de tecnología, como por ejemplo (pero no solo):
● RamaLamaun proyecto de código abierto que busca facilitar la gestión y la disponibilidad local de modelos de IA;
● TrustyAI, una caja de herramientas de código abierto para la construcción de flujos de trabajo de IA más responsables;
● Climatikun proyecto enfocado en ayudar a hacer que la IA sea más sostenible en cuanto al consumo de energía;
● Laboratorio de IA de Podmanuna caja de herramientas para desarrolladores enfocada en facilitar la experimentación con LLMs de código abierto;
ELanuncio recientesobre Neural Magic amplía la visión corporativa sobre IA, permitiendo que las organizaciones alineen modelos de IA más pequeños y optimizados, incluidos sistemas de código abierto licenciados, con sus datos, dondequiera que residan en la nube híbrida. Las organizaciones de TI pueden, entonces, utilizar el servidor de inferenciavLLMpara impulsar las decisiones y la producción de estos modelos, ayudando a construir una pila de IA basada en tecnologías transparentes y con soporte.
Para la corporación, la IA de código abierto vive y respira en la nube híbrida. La nube híbrida proporciona la flexibilidad necesaria para elegir el mejor entorno para cada carga de trabajo de IA, optimizando el rendimiento, costo, escala y requisitos de seguridad. Las plataformas, metas y organización de Red Hat apoyan estos esfuerzos, junto con socios del sector, clientes y la comunidad de código abierto, a medida que se impulsa el código abierto en la inteligencia artificial.
Existe un inmenso potencial para ampliar esa colaboración abierta en el ámbito de la IA. Red Hat ve un futuro que abarca trabajo transparente en modelos, así como su entrenamiento. Ya sea la próxima semana o el próximo mes (o incluso antes, dada la rapidez de la evolución de la IA), la empresa y la comunidad abierta, en su conjunto, seguirán apoyando y adoptando los esfuerzos para democratizar y abrir el mundo de la IA.