Bắt đầuTin tứcPhát hànhRed Hat AI alavanca a adoção da IA empresarial em todos os...

Red Hat AI alavanca a adoção da IA empresarial em todos os modelos, aceleradores de IA e nuvens

Novas atualizações em todo o portfólio de IA da Red Hat promovem grandes transformações no setor empresarial. Por meio do Red Hat AI, a empresa busca ampliar ainda mais as capacidades necessárias para acelerar a adoção da tecnologia, oferecendo mais liberdade e confiança aos clientes em implementações de IA generativa (gen AI) em ambientes de nuvem híbrida. A partir do o lançamento do Red Hat AI Inference Server, modelos validados por terceiros no Red Hat AI, e a integração com as APIs Llama Stack e Model Context Protocol (MCP), a companhia se reposiciona no mercado para diversas modalidades de inteligência artificial. 

De acordo com a Forrester, o software open source será o motor para acelerar os esforços de IA empresarial. À medida que o cenário de IA se torna mais complexo e dinâmico, o Red Hat AI Inference Server e os modelos validados por terceiros oferecem inferência eficiente e uma coleção testada de modelos de IA otimizados para desempenho na plataforma Red Hat AI. Com a integração de novas APIs para desenvolvimento de agentes de gen AI,  o que inclui Llama Stack e MCP, a Red Hat trabalha para simplificar a complexidade de implantação, capacitando líderes de TI, cientistas de dados e desenvolvedores a avançar suas iniciativas de IA com mais controle e eficiência.

Inferência eficiente na nuvem híbrida com Red Hat AI Inference Server

O portfólio Red Hat AI conta com a novidade Red Hat AI Inference Server,  dispondo de uma inferência mais rápida, consistente e econômica em escala, em ambientes de nuvem híbrida. Essa adição está integrada às versões mais recentes do Red Hat OpenShift AI e do Red Hat Enterprise Linux AI, e também está disponível como uma solução independente, permitindo que organizações implantem aplicações inteligentes com mais eficiência, flexibilidade e desempenho.

Modelos testados e otimizados com Red Hat AI e validação de terceiros

Os modelos validados por terceiros do Red Hat AI, disponíveis no Hugging Face, facilitam a escolha das empresas no momento de encontrar os modelos certos para suas necessidades. O Red Hat AI oferece uma coleção de modelos validados, além de orientações de implantação que aumentam a confiança dos clientes no desempenho dos modelos e na reprodutibilidade dos resultados. Modelos selecionados também são otimizados pela Red Hat, com técnicas de compressão de modelo que reduzem seu tamanho e aumentam a velocidade de inferência, ajudando a minimizar o consumo de recursos e os custos operacionais. Além disso, o processo contínuo de validação de modelos ajuda os clientes Red Hat AI a se manterem na vanguarda da inovação em gen AI.

APIs padronizadas para desenvolvimento de aplicações e agentes de IA com Llama Stack e MCP

O Red Hat AI está integrando o Llama Stack, inicialmente desenvolvido pela Meta, juntamente com o MCP da Anthropic, para fornecer APIs padronizadas para construção e implantação de aplicações e agentes de IA. Atualmente disponível em versão de prévia para desenvolvedores no Red Hat AI, o Llama Stack oferece uma API unificada para acesso a inferência com vLLM, geração aumentada por recuperação (RAG), avaliação de modelos, guardrails e agentes, em qualquer modelo de gen AI. O MCP permite que os modelos se integrem a ferramentas externas, fornecendo uma interface padronizada para conexão com APIs, plugins e fontes de dados em fluxos de trabalho de agentes.

A última versão do Red Hat OpenShift AI (v2.20) oferece melhorias adicionais para construir, treinar, implantar e monitorar modelos de IA generativa e preditiva em escala. Os destaques incluem:

  • Catálogo de modelos otimizado (prévia técnica): acesso facilitado a modelos validados da Red Hat e de terceiros, com implantação via console web e gerenciamento completo do ciclo de vida com registro integrado do OpenShift.
  • Treinamento distribuído com KubeFlow Training Operator: execução de ajustes de modelo com InstructLab e cargas de trabalho PyTorch distribuídas em vários nós e GPUs do Red Hat OpenShift, com rede RDMA distribuída para aceleração e melhor uso de GPU, a fim de reduzir custos. 
  • Feature store (prévia técnica): baseado no projeto upstream Kubeflow Feast, oferece um repositório centralizado para gerenciamento e fornecimento de dados para treinamento e inferência, otimizando o fluxo de dados e melhorando a precisão e reusabilidade dos modelos.

O O Red Hat Enterprise Linux AI 1.5 traz novas atualizações para a plataforma de modelos de base da Red Hat, voltada ao desenvolvimento, teste e execução de modelos de linguagem de grande escala (LLMs) . Os principais recursos da versão 1.5 do RHEL AI incluem:

  • Disponibilidade no Google Cloud Marketplace, ampliando a escolha dos clientes para rodar o Red Hat Enterprise Linux AI em nuvens públicas (além de AWS e Azure), facilitando a implantação e o gerenciamento de cargas de trabalho de IA no Google Cloud.
  • Capacidades aprimoradas em múltiplas línguas para espanhol, alemão, francês e italiano via InstructLab, permitindo personalização de modelos com scripts nativos e ampliando as possibilidades de aplicações de IA multilíngue. Os usuários também podem usar seus próprios modelos “teacher” e “student” para maior controle em personalização e testes, com suporte futuro previsto para japonês, hindi e coreano.

O O Red Hat AI InstructLab on IBM Cloud agora tem disponibilidade geral. Esse novo serviço em nuvem simplifica ainda mais o processo de personalização de modelos, melhorando a escalabilidade e a experiência do usuário. As empresas podem usar seus dados de forma mais eficiente e com maior controle.

Visão da Red Hat: qualquer modelo, qualquer acelerador, qualquer nuvem

O futuro da IA deve ser definido por oportunidades ilimitadas e não restrito por silos de infraestrutura. A Red Hat enxerga um horizonte no qual as organizações possam implantar qualquer modelo, em qualquer acelerador, em qualquer nuvem, entregando uma experiência de usuário excepcional e mais consistente, sem custos exorbitantes. Para desbloquear o verdadeiro potencial dos investimentos em gen AI, as empresas precisam de uma plataforma universal de inferência — um novo padrão para inovações em IA contínuas e de alto desempenho, tanto no presente quanto nos próximos anos.

Red Hat Summit

Participe das keynotes do Red Hat Summit para ouvir as últimas novidades de executivos, clientes e parceiros da Red Hat:

Cập nhật thương mại điện tử
Cập nhật thương mại điện tửhttps://www.ecommerceupdate.org
E-Commerce Update là công ty hàng đầu tại thị trường Brazil, chuyên sản xuất và phổ biến nội dung chất lượng cao về lĩnh vực thương mại điện tử.
BÀI VIẾT LIÊN QUAN

Để lại câu trả lời

Vui lòng nhập bình luận của bạn!
Vui lòng nhập tên của bạn vào đây

GẦN ĐÂY

PHỔ BIẾN NHẤT

[elfsight_cookie_consent id="1"]