Pembaruan terbaru di seluruh portofolio AI Red Hat mendorong transformasi signifikan di sektor enterprise. Melalui Red Hat AI, perusahaan bertujuan untuk lebih memperluas kapabilitas yang dibutuhkan guna mempercepat adopsi teknologi, menawarkan kebebasan dan keyakinan yang lebih besar kepada pelanggan dalam penerapan AI generatif (gen AI) di lingkungan cloud hybrid. Dengan peluncuran Red Hat AI Inference Server, model tervalidasi pihak ketiga dalam Red Hat AI, dan integrasi dengan Llama Stack dan Model Context Protocol (MCP) API, perusahaan memposisikan ulang dirinya di pasar untuk berbagai bentuk kecerdasan buatan.
Menurut Forrester, perangkat lunak sumber terbuka akan menjadi mesin penggerak percepatan upaya AI perusahaan. Seiring lanskap AI menjadi lebih kompleks dan dinamis, Red Hat AI Inference Server dan model tervalidasi pihak ketiga menyediakan inferensi yang efisien dan kumpulan model AI yang teruji dan dioptimalkan performanya pada platform Red Hat AI. Dengan integrasi API baru untuk mengembangkan agen AI, termasuk Llama Stack dan MCP, Red Hat berupaya menyederhanakan kompleksitas penerapan, memberdayakan para pemimpin TI, ilmuwan data, dan pengembang untuk memajukan inisiatif AI mereka dengan kontrol dan efisiensi yang lebih baik.
Inferensi efisien di cloud hybrid dengan Red Hat AI Inference Server
Portofolio Red Hat AI mencakup Red Hat AI Inference Server , yang menghadirkan inferensi yang lebih cepat, lebih konsisten, dan hemat biaya dalam skala besar di seluruh lingkungan cloud hybrid. Tambahan ini terintegrasi ke dalam versi terbaru Red Hat OpenShift AI dan Red Hat Enterprise Linux AI, dan juga tersedia sebagai solusi mandiri, yang memungkinkan organisasi untuk menerapkan aplikasi cerdas dengan efisiensi, fleksibilitas, dan performa yang lebih baik.
Model diuji dan dioptimalkan dengan Red Hat AI dan validasi pihak ketiga
Model tervalidasi pihak ketiga Red Hat AI , tersedia di Hugging Face , memudahkan perusahaan menemukan model yang tepat untuk kebutuhan mereka. Red Hat AI menawarkan koleksi model tervalidasi, beserta panduan penerapan, untuk meningkatkan kepercayaan pelanggan terhadap kinerja dan reproduktifitas model. Model-model tertentu juga dioptimalkan oleh Red Hat, menggunakan teknik kompresi model yang mengurangi ukuran model dan meningkatkan kecepatan inferensi, membantu meminimalkan konsumsi sumber daya dan biaya operasional. Lebih lanjut, proses validasi model yang berkelanjutan membantu pelanggan Red Hat AI tetap menjadi yang terdepan dalam inovasi di Gen AI.
API standar untuk mengembangkan aplikasi dan agen AI dengan Llama Stack dan MCP
Red Hat AI mengintegrasikan Llama Stack , yang awalnya dikembangkan oleh Meta, dengan MCP , untuk menyediakan API standar bagi pembangunan dan penerapan aplikasi dan agen AI. Saat ini tersedia dalam pratinjau pengembang di Red Hat AI, Llama Stack menawarkan API terpadu untuk mengakses inferensi vLLM, pembangkitan augmented-recovery (RAG), evaluasi model, guardrail , dan agen, di seluruh model AI. MCP memungkinkan model untuk terintegrasi dengan alat eksternal, menyediakan antarmuka standar untuk terhubung ke API, plugin, dan sumber data dalam alur kerja agen.
Rilis terbaru Red Hat OpenShift AI (v2.20 ) menawarkan penyempurnaan tambahan untuk membangun, melatih, menerapkan, dan memantau model AI generatif dan prediktif dalam skala besar. Beberapa hal penting meliputi:
- Katalog Templat yang Disederhanakan (Pratinjau Teknis): Akses lebih mudah ke templat Red Hat dan pihak ketiga yang tervalidasi, dengan penerapan konsol web dan manajemen siklus hidup penuh dengan registri OpenShift terintegrasi.
- Pelatihan terdistribusi dengan KubeFlow Training Operator : Menjalankan penyesuaian model dengan beban kerja InstructLab dan PyTorch yang didistribusikan di beberapa node Red Hat OpenShift dan GPU, dengan jaringan RDMA terdistribusi untuk akselerasi dan pemanfaatan GPU yang lebih baik guna mengurangi biaya.
- Penyimpanan fitur (pratinjau teknis): Berdasarkan proyek Kubeflow Feast di hulu, ia menawarkan repositori terpusat untuk mengelola dan menyajikan data untuk pelatihan dan inferensi, mengoptimalkan aliran data, dan meningkatkan akurasi serta penggunaan ulang model.
Red Hat Enterprise Linux AI 1.5 menghadirkan pembaruan baru pada platform pemodelan dasar Red Hat, yang dirancang untuk mengembangkan, menguji, dan menjalankan model bahasa skala besar (LLM). Fitur-fitur utama RHEL AI 1.5 meliputi:
- Ketersediaan di Google Cloud Marketplace, memperluas pilihan pelanggan untuk menjalankan Red Hat Enterprise Linux AI di cloud publik (di luar AWS dan Azure), membuatnya lebih mudah untuk menyebarkan dan mengelola beban kerja AI di Google Cloud.
- Peningkatan kemampuan multibahasa untuk bahasa Spanyol, Jerman, Prancis, dan Italia melalui InstructLab, memungkinkan kustomisasi model dengan skrip asli dan memperluas kemungkinan untuk aplikasi AI multibahasa. Pengguna juga dapat menambahkan model "guru" dan "siswa" mereka sendiri untuk kontrol yang lebih besar atas kustomisasi dan pengujian, dengan dukungan yang direncanakan untuk bahasa Jepang, Hindi, dan Korea di masa mendatang.
Red Hat AI InstructLab di IBM Cloud kini tersedia secara umum. Layanan cloud baru ini semakin menyederhanakan proses kustomisasi model, meningkatkan skalabilitas dan pengalaman pengguna. Perusahaan dapat menggunakan data mereka secara lebih efisien dan dengan kontrol yang lebih besar.
Red Hat Vision: Model Apa Pun, Akselerator Apa Pun, Cloud Apa Pun
Masa depan AI seharusnya ditentukan oleh peluang tanpa batas, bukan dibatasi oleh silo infrastruktur. Red Hat membayangkan masa depan di mana organisasi dapat menerapkan model apa pun, di akselerator apa pun, di cloud apa pun, memberikan pengalaman pengguna yang luar biasa dan lebih konsisten tanpa biaya selangit. Untuk membuka potensi investasi Gen AI yang sesungguhnya, perusahaan membutuhkan platform inferensi universal—sebuah standar baru untuk inovasi AI yang berkelanjutan dan berkinerja tinggi, baik saat ini maupun di tahun-tahun mendatang.
KTT Red Hat
Bergabunglah dalam keynote Red Hat Summit untuk mendengar informasi terbaru dari para eksekutif, pelanggan, dan mitra Red Hat:
- Infrastruktur Modern yang Sejalan dengan Kecerdasan Buatan Perusahaan — Selasa, 20 Mei, pukul 08.00 - 10.00 EDT ( YouTube )
- Cloud Hibrida Berkembang untuk Mendorong Inovasi Bisnis — Rabu, 21 Mei, pukul 08.00-09.30 EDT ( YouTube )