Las nuevas actualizaciones en la cartera de IA de Red Hat impulsan importantes transformaciones en la industria empresarial. A través de Red Hat AI, la empresa busca ampliar aún más las capacidades necesarias para acelerar la adopción de tecnología, ofreciendo más libertad y confianza a los clientes en implementaciones de IA generativa (IA de generación) en entornos de nube híbrida. A partir del lanzamiento de Red Hat AI Inference Server, modelos validados por terceros en Red Hat AI e integración con las API Llama Stack y Model Context Protocol (MCP), la empresa se reposiciona en el mercado para diversas modalidades de inteligencia artificial.
Según Forrester, el software de código abierto será el motor para acelerar los esfuerzos de IA empresarial. A medida que el panorama de la IA se vuelva más complejo y dinámico, el Servidor de inferencia Red Hat AI y los modelos validados por terceros ofrecen inferencia eficiente y una colección probada de modelos de IA de rendimiento optimizado en la plataforma Red Hat AI. Al integrar nuevas API para el desarrollo de agentes de IA gen, que incluyen Llama Stack y MCP, Red Hat trabaja para simplificar la complejidad de la implementación, capacitando a líderes de TI, científicos de datos y desarrolladores para avanzar en sus iniciativas de IA con más control y eficiencia.
Inferencia eficiente de nube híbrida con Red Hat AI Inference Server
La cartera de Red Hat AI presenta lo nuevo Servidor de inferencia Red Hat AI, que presenta inferencias más rápidas, consistentes y rentables a escala en entornos de nube híbrida. Esta incorporación está integrada con las últimas versiones de Red Hat OpenShift AI y Red Hat Enterprise Linux AI, y también está disponible como una solución independiente, lo que permite a las organizaciones implementar aplicaciones inteligentes con mayor eficiencia, flexibilidad y rendimiento.
Modelos probados y optimizados con Red Hat AI y validación de terceros
Los modelos validados por terceros de Red Hat AI, disponible en Abrazando la cara, Facilite a las empresas la elección de los modelos adecuados para sus necesidades. Red Hat AI ofrece una colección de modelos validados, así como orientación de implementación que aumenta la confianza del cliente en el rendimiento del modelo y la reproducibilidad de los resultados. Red Hat también optimiza los modelos seleccionados, con técnicas de compresión de modelos que reducen su tamaño y aumentan la velocidad de inferencia, lo que ayuda a minimizar el consumo de recursos y los costos operativos. Además, el proceso de validación continua del modelo ayuda a los clientes de Red Hat AI a mantenerse a la vanguardia de la innovación en IA de generación.
Api estandarizadas para aplicaciones de IA y desarrollo de agentes con Llama Stack y MCP
Red Hat AI está integrando el Llama Stackdesarrollado inicialmente por Meta, junto con el MCP desde Anthropic, para proporcionar API estandarizadas para crear e implementar aplicaciones y agentes de IA. Actualmente disponible en la versión preliminar para desarrolladores en Red Hat AI, Llama Stack proporciona una API unificada para acceso a inferencias con vLLM, generación mejorada por recuperación (RAG), evaluación de modelos y más barandillas y agentes, en cualquier modelo de generación de IA.MCP permite que los modelos se integren con herramientas externas, proporcionando una interfaz estandarizada para conectarse a API, complementos y fuentes de datos en los flujos de trabajo de los agentes.
La última versión de Sombrero rojo OpenShift AI (v2.20) Proporciona mejoras adicionales para construir, entrenar, implementar y monitorear modelos de IA generativos y predictivos a escala. Los aspectos más destacados incluyen:
- Catálogo de modelos optimizado (vista previa técnica): fácil acceso a Red Hat validado y modelos de terceros, con implementación de consola web y gestión completa del ciclo de vida con inscripción OpenShift integrada.
- Capacitación distribuida con KubeFlow Training Operador: ejecute ajustes de modelo con cargas de trabajo InstructLab y PyTorch distribuidas en múltiples nodos y GPU Red Hat OpenShift, con redes RDMA distribuidas para aceleración y mejor uso de GPU, para reducir costos.
- Tienda de funciones (vista previa técnica): basado en el proyecto Kubeflow Feast upstream, ofrece un repositorio centralizado para administrar y entregar datos para capacitación e inferencia, optimizar el flujo de datos y mejorar la precisión y reutilización del modelo.
O Red Hat Enterprise Linux AI 1.5 aporta nuevas actualizaciones a la plataforma de modelos principales de Red Hat, que se centra en desarrollar, probar y ejecutar modelos de lenguaje (LLM) a gran escala. Las características clave de RHEL AI versión 1.5 incluyen:
- Disponibilidad en Google Cloud Marketplace ampliar la elección de los clientes de ejecutar Red Hat Enterprise Linux AI en nubes públicas (además de AWS y Azure), facilitando la implementación y administración de cargas de trabajo de IA en Google Cloud.
- Capacidades mejoradas en varios idiomas para español, alemán, francés e italiano a través de InstructLab, permitiendo la personalización de modelos con scripts nativos y ampliando las posibilidades de aplicaciones de IA multilingües. Los usuarios también pueden utilizar su propio “maestro” y “estudiante” para un mayor control en la personalización y las pruebas, con soporte futuro previsto para japonés, hindi y coreano.
O Red Hat AI InstructLab en IBM Cloud este nuevo servicio en la nube simplifica aún más el proceso de personalización de modelos, mejorando la escalabilidad y la experiencia del usuario. Las empresas pueden utilizar sus datos de forma más eficiente y con mayor control.
Visión de Red Hat: cualquier modelo, cualquier acelerador, cualquier nube
El futuro de la IA debe definirse por oportunidades ilimitadas y no limitado por silos de infraestructura. Red Hat ve un horizonte en el que las organizaciones pueden implementar cualquier modelo, en cualquier acelerador, en cualquier nube, brindando una experiencia de usuario excepcional y más consistente, sin costo exorbitante. Para desbloquear el verdadero potencial de las inversiones gen AI, las empresas necesitan una plataforma de inferencia universal y un nuevo estándar para innovaciones continuas y de alto rendimiento en IA, tanto ahora como en los años venideros.
Cumbre del Sombrero Rojo
Únase a las conferencias magistrales de Red Hat Summit para escuchar lo último de los ejecutivos, clientes y socios de Red Hat:
- Infraestructura moderna alineada con la IA empresarial 20 de mayo, 8h - 10h EDT (YouTube)
- La nube híbrida evoluciona para impulsar la innovación empresarial 21 mai, 8h-9h30 EDT (YouTube)