Doi jucători în transformarea deschisă a inteligenței artificiale tocmai au anunțat o extindere a colaborării lor pentru a stimula IA. Dezvoltarea parteneriatului dintre Red Hat și Google Cloud se concentrează pe extinderea gamei de aplicații enterprise pentru IA, combinând tehnologiile open-source ale liderului open-source cu infrastructura specializată a Google și familia sa de modele, Gemma.
Împreună, companiile vor dezvolta cazuri de utilizare pentru scalarea inteligenței artificiale prin:
- Lansarea proiectului open source llm-d, cu Google ca și contribuitor fondator;
- Suport pentru vLLM pe TPU-uri Google Cloud și mașini virtuale (VM) compatibile cu GPU pentru a îmbunătăți inferența AI;
- Suport zero-day pentru vLLM cu distribuții de modele Gemma 3;
- Disponibilitatea serverului Red Hat AI Inference pe Google Cloud;
- Dezvoltarea inteligenței artificiale agențice cu Red Hat ca și colaborator la protocolul Agent2Agent (A2A) al Google.
Consolidarea inferenței AI cu vLLM
Demonstrându-și angajamentul față de pregătirea de la prima zi, Red Hat este acum unul dintre primii testeri ai familiei de modele deschise Gemma de la Google, începând cu Gemma 3, cu suport imediat pentru vLLM . vLLM este un server de inferență open-source care accelerează execuția aplicațiilor de inteligență artificială generativă. În calitate de contribuitor comercial important la vLLM, Red Hat face ca această platformă să fie mai eficientă și mai receptivă pentru aplicațiile de inteligență artificială generativă.
În plus, TPU-urile Google Cloud, acceleratoare de inteligență artificială de înaltă performanță care fac parte din portofoliul de inteligență artificială al Google, sunt acum complet compatibile cu vLLM . Această integrare permite dezvoltatorilor să maximizeze resursele, atingând în același timp performanța și eficiența esențiale pentru inferențe rapide și precise.
Recunoscând tranziția de la cercetarea în domeniul inteligenței artificiale la implementarea în lumea reală, multe organizații se confruntă cu complexitățile unui ecosistem de inteligență artificială divers și cu nevoia de a adopta strategii de calcul mai distribuite. Pentru a răspunde acestei cereri, Red Hat a lansat proiectul open-source llm-d , cu Google ca și contribuitor fondator. Valorificând impulsul comunității vLLM, această inițiativă își propune să inaugureze o nouă eră pentru inferența genelor bazată pe inteligență artificială. Scopul este de a permite o scalabilitate mai mare în resurse eterogene, de a optimiza costurile și de a crește eficiența volumului de lucru - toate acestea promovând în același timp inovația continuă.
Impulsionarea inteligenței artificiale în întreprinderi cu inovație bazată pe comunitate
Aducând cele mai recente progrese din comunitatea open source în mediul enterprise, Red Hat AI Inference Server este acum . Similar distribuției vLLM pentru întreprinderi de la Red Hat, AI Inference Server ajută companiile să optimizeze inferența modelelor în mediul lor cloud hibrid. Folosind infrastructura de încredere a Google Cloud, organizațiile pot implementa modele de inteligență artificială generativă, pregătite pentru producție, care sunt atât extrem de receptive, cât și eficiente din punct de vedere al costurilor la scară largă.
Subliniind angajamentul său comun față de inteligența artificială deschisă, Red Hat a început, de asemenea, să contribuie la Agent2Agent (A2A) de la Google - un protocol la nivel de aplicație care facilitează comunicarea dintre agenți și utilizatorii finali pe diverse platforme și cloud-uri. Prin participarea activă la ecosistemul A2A, Red Hat urmărește să accelereze inovația și să se asigure că fluxurile de lucru bazate pe inteligența artificială rămân dinamice și eficiente cu puterea inteligenței artificiale Agentic .
Summitul Red Hat
Urmăriți discursurile principale de la Red Hat Summit pentru a afla cele mai recente știri de la directorii, clienții și partenerii Red Hat:
- Infrastructură modernă aliniată cu inteligența artificială la nivel de întreprindere — marți, 20 mai, 8-10 AM EDT ( YouTube )
- Cloudul hibrid evoluează pentru a stimula inovația în afaceri — miercuri, 21 mai, 8-9:30 AM EDT ( YouTube )

