Uudet päivitykset koko Red Hat'n tekoälyportfoliossa edistävät suuria muutoksia yrityssektorilla. Red Hat AI:n avulla yritys pyrkii laajentamaan entisestään tarvittavia kykyjä teknologian käyttöönoton nopeuttamiseksi tarjoamalla asiakkaille enemmän vapautta ja luottamusta generatiivisen tekoälyn (gen AI) käyttöönotossa hybridipilviympäristöissä. Red Hat AI Inference Serverin, kolmansien osien validointimallien Red Hat AI:ssa ja Llama Stack - ja Model Context Protocol (MCP) - API-in integroinnin jälkeen yhtiö uudelleen asemoituu markkinoilla eri tekoälymuotoja varten.
Forresterin mukaan avoimen lähdekoodin ohjelmisto tulee olemaan moottori yrityskohtaisen tekoälyn ponnistelujen nopeuttamiseksi. Kun tekoälyympäristö muuttuu monimutkaisemmaksi ja dynaamisemmaksi, theRed Hat AI Inferenssipalvelinja vahvistetut mallit tarjoavat tehokkaan päättelyn ja testatun kokoelman optimoituja tekoälymalleja Red Hat AI -alustalla suorituskyvyn parantamiseksi. Uusien API-jen integroinnin, kuten Llama Stackin ja MCP:n, avulla Red Hat työskentelee yksinkertaistaakseen käyttöönoton monimutkaisuutta, antaakseen IT-johtajille, datatieteilijöille ja kehittäjille mahdollisuuden edistää tekoälyhankkeitaan enemmän hallintaa ja tehokkuutta.
Tehokas inferenssi hybridipilvessä Red Hat AI Inference Serverillä
Red Hat AI -portfoliolla on uusi ominaisuusRed Hat AI Inferenssipalvelin, tarjoten nopeamman, johdonmukaisemman ja kustannustehokkaamman päätelmän pilviympäristöissä hybridissä. Tämä lisäys on integroitu uusimpiin Red Hat OpenShift AI:n ja Red Hat Enterprise Linux AI:n versioihin ja on myös saatavilla itsenäisenä ratkaisuna, mikä mahdollistaa organisaatioiden älykkäiden sovellusten käyttöönoton tehokkaammin, joustavammin ja suorituskykyisemmin.
Testatut ja optimoidut mallit Red Hat AI:n ja kolmannen osapuolen validoinnilla
Red Hat AI:n kolmannen osapuolen vahvistamat mallitsaatavilla olevatHugging Facehelpottaa yritysten valintaa löytääksesi oikeat mallit tarpeisiinsa. Red Hat AI tarjoaa valtuutettujen mallien kokoelman sekä käyttöönotto-ohjeita, jotka lisäävät asiakkaiden luottamusta mallien suorituskykyyn ja tulosten toistettavuuteen. Valitut mallit optimoidaan myös Red Hatilla, käyttämällä mallin pakkaustekniikoita, jotka pienentävät niiden kokoa ja lisäävät ennusteen nopeutta, auttaen minimoimaan resurssien kulutusta ja käyttökustannuksia. Lisäksi jatkuva mallien validointiprosessi auttaa Red Hat AI:n asiakkaita pysymään gen AI -innovaation eturintamassa.
Standardoidut API:t tekoälysovellusten ja agenttien kehittämiseen Llama Stackin ja MCP:n kanssa
Red Hat AI integreerii tällä hetkelläLlama-pinoalun perin kehitetty Meta:n toimesta, yhdessä kanssaMCPAnthropic tarjoaa standardoituja API-rajapintoja tekoälysovellusten ja agenttien rakentamiseen ja käyttöönottoon. Tällä hetkellä Red Hat AI:n kehittäjille tarkoitettu esiversio Llama Stack tarjoaa yhtenäisen API:n pääsyyn inferenssiin vLLM:llä, palautusperustaisen generoinnin (RAG), mallien arvioinnin,kaiteetja agentit, kaikissa generatiivisen tekoälyn malleissa. MCP mahdollistaa mallien integroinnin ulkoisiin työkaluihin tarjoamalla standardoidun käyttöliittymän yhteyteen API-ihin, lisäosiin ja tietolähteisiin agenttien työnkulkuissa.
Viimeisin versioRed Hat OpenShift AI (versio 2.20tarjoaa lisäparannuksia generatiivisten ja ennustavien tekoälymallien rakentamiseen, kouluttamiseen, käyttöönottoon ja valvontaan skaalassa. Korostukset sisältävät:
- Optimoitu malliluettelo (tekninen esittely)Helppo pääsy Red Hat ja kolmansien osapuolien validoituihin malleihin, web-konsolin kautta toteutettuna ja koko elinkaaren hallinta OpenShiftin integroitu rekisteri mukaan lukien.
- Jakautunut koulutus KubeFlow Training Operatorillamallin säätöjen suorittaminen InstructLabilla ja PyTorch-kuormien jakaminen useille solmuille ja GPU:ille Red Hat OpenShiftissä, käyttäen jaettua RDMA-verkkoa nopeutukseen ja paremman GPU:n hyödyntämisen saavuttamiseksi, kustannusten vähentämiseksi.
- Ominaisuusvarasto (tekninen esittely):Perustuen Upstream Kubeflow Feast -projektiin, se tarjoaa keskitetyn arkiston datojen hallintaan ja toimittamiseen koulutusta ja ennustamista varten, optimoiden datavirtaa ja parantaen mallien tarkkuutta ja uudelleenkäytettävyyttä.
THERed Hat Enterprise Linux AI 1.5toistaa uusia päivityksiä Red Hat -mallialustalle, joka on suunniteltu suurikokoisten kielimallien (LLM) kehittämiseen, testaamiseen ja suorittamiseen. RHEL AI version 1.5:n tärkeimmät ominaisuudet ovat:
- Saatavuus Google Cloud Marketplacessälaajentamalla asiakkaiden valinnanmahdollisuuksia käyttää Red Hat Enterprise Linux AI:ta julkisissa pilvissä (lukuun ottamatta AWS:ää ja Azurea), helpottaen tekoälykuormien käyttöönottoa ja hallintaa Google Cloudissa.
- Parannetut monikieliset kyvytespanjol, saksa, ranska ja italia InstructLabin kautta, mikä mahdollistaa mallien räätälöinnin omilla skripteillä ja laajentaa monikielisten tekoälysovellusten mahdollisuuksia. Käyttäjät voivat myös käyttää omia "opettaja" ja "opiskelija" -mallejaan paremman hallinnan, räätälöinnin ja testauksen saavuttamiseksi, ja tulevaisuudessa odotetaan tukea japanille, hindille ja korealle.
THE Red Hat AI InstructLab IBM Cloudilla Nyt on yleinen saatavuus. Tämä uusi pilvipalvelu yksinkertaistaa entisestään mallien räätälöintiprosessia, parantaen skaalautuvuutta ja käyttäjäkokemusta. Yritykset voivat käyttää tietojaan tehokkaammin ja hallita niitä paremmin.
Red Hatin näkemys: mikä tahansa malli, mikä tahansa kiihdytin, mikä tahansa pilvi
Tulevaisuus tekoälyssä tulee määrittyä rajattomien mahdollisuuksien perusteella eikä infrastruktuurin erillisten osien rajoittamana. Red Hat näkee horisontin, jossa organisaatiot voivat ottaa käyttöön minkä tahansa mallin, missä tahansa nopeuttimessa, missä tahansa pilvessä, tarjoten poikkeuksellisen ja johdonmukaisemman käyttäjäkokemuksen ilman kohtuuttomia kustannuksia. Jotta voidaan vapauttaa todellinen potentiaali gen AI -investoinneissa, yritysten tarvitsee yhtenäinen inferenssialusta — uusi standardi jatkuville ja korkeasuorituskykyisille tekoälyinnovaatioille sekä nykyhetkessä että tulevina vuosina.
Red Hat huippukokous
Osallistu Red Hat Summitin avauspuheisiin kuullaksesi viimeisimmät uutiset Red Hatilta johtajilta, asiakkailta ja kumppaneilta:
- Nykyinen infrastruktuuri, joka on linjassa yrityskohtaisen tekoälyn kanssaTiistai, 20. toukokuuta, klo 8–10 EDTYouTube)
- Hybridipilvi kehittyy edistääkseen yritysinnovaatiotaKeskiviikko, 21. toukokuuta, klo 8–9.30 EDTYouTube)