Lebih dari tiga dekade lalu, Red Hat melihat potensi pengembangan dan lisensi sumber terbuka untuk menciptakan perangkat lunak yang lebih baik dan mendorong inovasi TI. Tiga puluh juta baris kode kemudian, Linux tidak hanya berkembang menjadi perangkat lunak sumber terbuka yang paling sukses, tetapi juga mempertahankan posisi tersebut hingga saat ini. Komitmen terhadap prinsip-prinsip sumber terbuka terus berlanjut, tidak hanya dalam model bisnis perusahaan, tetapi juga sebagai bagian dari budaya kerja. Dalam penilaian perusahaan, konsep-konsep ini memiliki dampak yang sama pada kecerdasan buatan (AI) jika dilakukan dengan benar, tetapi dunia teknologi terbagi pendapat tentang apa yang dimaksud dengan "cara yang benar".
AI, khususnya model bahasa besar (LLM) di balik AI generatif (gen AI), tidak dapat dipandang dengan cara yang sama seperti program sumber terbuka. Tidak seperti perangkat lunak, model AI terutama terdiri dari model parameter numerik yang menentukan bagaimana model memproses input, serta koneksi yang dibuatnya antara berbagai titik data. Parameter model terlatih adalah hasil dari proses panjang yang melibatkan sejumlah besar data pelatihan yang dipersiapkan, dicampur, dan diproses dengan cermat.
Meskipun parameter model bukanlah perangkat lunak, dalam beberapa hal parameter tersebut memiliki fungsi yang mirip dengan kode. Sangat mudah untuk membandingkan data dengan kode sumber model, atau sesuatu yang sangat mirip dengannya. Dalam perangkat lunak sumber terbuka, kode sumber umumnya didefinisikan sebagai "cara yang lebih disukai" untuk melakukan modifikasi pada perangkat lunak. Data pelatihan saja tidak sesuai dengan fungsi ini, mengingat ukurannya yang bervariasi dan proses pra-pelatihan yang rumit yang menghasilkan hubungan yang lemah dan tidak langsung antara setiap item data yang digunakan dalam pelatihan dengan parameter yang dilatih dan perilaku model yang dihasilkan.
Sebagian besar peningkatan dan perbaikan pada model AI yang saat ini terjadi di komunitas tidak melibatkan akses atau manipulasi data pelatihan asli. Sebaliknya, hal tersebut dihasilkan dari modifikasi parameter model atau proses atau penyesuaian yang juga dapat berfungsi untuk menyempurnakan kinerja model. Kebebasan untuk melakukan perbaikan model ini mensyaratkan agar parameter tersebut dirilis dengan semua izin yang diterima pengguna di bawah lisensi sumber terbuka.
Visi Red Hat untuk AI sumber terbuka.
Red Hat percaya bahwa fondasi AI sumber terbuka terletak pada parameter model berlisensi sumber terbuka yang dikombinasikan dengan komponen perangkat lunak sumber terbuka . Ini adalah titik awal untuk AI sumber terbuka, tetapi bukan tujuan akhir dari filosofi tersebut. Red Hat mendorong komunitas sumber terbuka, otoritas pengatur, dan industri untuk terus berupaya mencapai transparansi dan keselarasan yang lebih besar dengan prinsip-prinsip pengembangan sumber terbuka saat melatih dan menyempurnakan model AI.
Inilah visi Red Hat sebagai perusahaan yang mencakup ekosistem perangkat lunak sumber terbuka dan dapat secara praktis terlibat dengan AI sumber terbuka. Ini bukan upaya untuk membuat definisi formal, seperti yang sedang dikembangkan oleh Open Source Initiative Definisi AI Sumber Terbuka (OSAID). Ini adalah perspektif perusahaan tentang bagaimana membuat AI sumber terbuka layak dan dapat diakses oleh berbagai komunitas, organisasi, dan vendor seluas mungkin.
Perspektif ini dipraktikkan melalui kerja sama dengan komunitas sumber terbuka, yang ditunjukkan oleh InstructLab , yang dipimpin oleh Red Hat, dan upaya bersama IBM Research pada keluarga model sumber terbuka berlisensi Granite . InstructLab secara signifikan mengurangi hambatan bagi non-ilmuwan data untuk berkontribusi pada model AI. Dengan InstructLab, para ahli di berbagai bidang dari semua sektor dapat menambahkan keterampilan dan pengetahuan mereka, baik untuk penggunaan internal maupun untuk membantu menciptakan model AI sumber terbuka yang dapat diakses secara luas dan digunakan bersama oleh komunitas hulu.
Rangkaian model Granite 3.0 menangani berbagai kasus penggunaan AI, mulai dari pembuatan kode hingga pemrosesan bahasa alami hingga ekstraksi wawasan dari kumpulan data besar, semuanya di bawah lisensi sumber terbuka yang permisif. Kami membantu IBM Research membawa rangkaian model kode Granite ke dunia sumber terbuka dan terus mendukung rangkaian model tersebut, baik dari perspektif sumber terbuka maupun sebagai bagian dari penawaran Red Hat AI kami.
Dampak dari pengumuman DeepSeek baru-baru ini menunjukkan bagaimana inovasi sumber terbuka dapat memengaruhi AI, baik pada tingkat model maupun lebih jauh lagi. Jelas, ada kekhawatiran tentang pendekatan platform Tiongkok tersebut, khususnya bahwa lisensi model tersebut tidak menjelaskan bagaimana model itu diproduksi, yang memperkuat kebutuhan akan transparansi. Meskipun demikian, gangguan yang disebutkan di atas memperkuat visi Red Hat untuk masa depan AI: masa depan terbuka yang berfokus pada model yang lebih kecil, dioptimalkan, dan terbuka yang dapat disesuaikan untuk kasus penggunaan data perusahaan tertentu di lokasi mana pun dalam cloud hibrida.
Memperluas model AI di luar sumber terbuka.
Kontribusi Red Hat di bidang AI sumber terbuka jauh melampaui InstructLab dan keluarga model Granite, meluas ke alat dan platform yang dibutuhkan untuk benar-benar mengonsumsi dan menggunakan AI secara produktif. Perusahaan ini telah sangat aktif dalam membina proyek dan komunitas teknologi, seperti (tetapi tidak terbatas pada):
● RamaLama , sebuah proyek sumber terbuka yang bertujuan untuk memfasilitasi pengelolaan dan penerapan model AI secara lokal;
● TrustyAI , sebuah perangkat lunak sumber terbuka untuk membangun alur kerja AI yang lebih bertanggung jawab;
● Climatik , sebuah proyek yang berfokus pada upaya menjadikan AI lebih berkelanjutan dalam hal konsumsi energi;
● Podman AI Lab , sebuah perangkat bantu pengembang yang berfokus pada memfasilitasi eksperimen dengan LLM sumber terbuka;
Pengumuman terbaru tentang Neural Magic memperluas visi perusahaan untuk AI, memungkinkan organisasi untuk menyelaraskan model AI yang lebih kecil dan dioptimalkan, termasuk sistem sumber terbuka berlisensi, dengan data mereka, di mana pun data tersebut berada di cloud hibrida. Organisasi TI kemudian dapat menggunakan vLLM untuk mendorong pengambilan keputusan dan produksi dari model-model ini, membantu membangun tumpukan AI berdasarkan teknologi yang transparan dan didukung.
Bagi perusahaan, AI sumber terbuka hidup dan berkembang di cloud hibrida. Cloud hibrida memberikan fleksibilitas yang dibutuhkan untuk memilih lingkungan terbaik untuk setiap beban kerja AI, mengoptimalkan kinerja, biaya, skala, dan persyaratan keamanan. Platform, tujuan, dan organisasi Red Hat mendukung upaya ini, bersama dengan mitra industri, pelanggan, dan komunitas sumber terbuka, seiring dengan semakin majunya pengembangan sumber terbuka dalam kecerdasan buatan.
Terdapat potensi yang sangat besar untuk memperluas kolaborasi terbuka ini di bidang AI. Red Hat membayangkan masa depan yang mencakup pekerjaan transparan pada model, serta pelatihannya. Baik minggu depan atau bulan depan (atau bahkan lebih cepat, mengingat evolusi AI yang pesat), perusahaan dan komunitas terbuka secara keseluruhan akan terus mendukung dan merangkul upaya untuk mendemokratisasi dan membuka dunia AI.

