三十多年前,紅帽公司就看到了開源開發和授權的巨大潛力,它能夠創造更優質的軟體,並促進IT創新。如今,Linux已經累積了三千萬行程式碼,不僅發展成為最成功的開源軟體,而且至今仍保持著這一地位。紅帽公司對開源原則的承諾不僅體現在其企業商業模式中,也融入了企業文化。公司認為,如果運用得當,這些理念對人工智慧(AI)同樣具有深遠的影響,但對於何為「正確」的做法,科技界仍存在分歧。
人工智慧,尤其是生成式人工智慧(gen AI)背後的大型語言模型(LLM),不能像開源程式那樣看待。與軟體不同,人工智慧模型主要由數值參數模型構成,這些參數決定了模型如何處理輸入,以及它在各個數據點之間建立的聯繫。訓練模型的參數是經過漫長過程的結果,該過程涉及大量經過精心準備、混合和處理的訓練資料。
儘管模型參數並非軟體,但在某些方面它們的作用類似於程式碼。我們可以輕鬆地將資料與模型的原始碼(或與其非常接近的某種形式)進行比較。在開源軟體領域,原始碼通常被定義為修改軟體的「首選方式」。然而,僅憑訓練資料本身並不符合此概念,因為訓練資料的大小不一,而且預訓練過程十分複雜,導致任何用於訓練的資料項與訓練後的參數以及模型的最終行為之間的聯繫都十分薄弱且間接。
目前社群中大多數針對人工智慧模型的改進和增強並不涉及存取或篡改原始訓練資料。相反,它們源自於模型參數的修改,或透過某種流程或調整來微調模型效能。要實現這些模型改進,就必須以開源授權協議賦予使用者的所有權限來發布模型參數。
紅帽對開源人工智慧的願景。
紅帽認為,開源人工智慧的基礎在於開源授權的模型參數與開源軟體元件的結合。這只是開源人工智慧的起點,而非其最終目標。紅帽鼓勵開源社群、監管機構和產業在訓練和調優人工智慧模型時,繼續努力提高透明度,並更加遵循開源開發原則。
這是紅帽公司作為一家涵蓋開源軟體生態系統並能切實參與開源人工智慧的公司的願景。這並非像開源促進會(OSI) 正在製定的開源人工智慧定義(OSAID) 那樣,試圖給出正式的定義。這代表了紅帽公司對於如何使開源人工智慧切實可行並惠及盡可能多的社群、組織和供應商的看法。
這種理念透過與開源社群的合作而實踐,其中最突出的例子是紅帽公司主導的InstructLab開發的 Granite 系列授權開源模型。 InstructLab 顯著降低了非資料科學家貢獻 AI 模型的門檻。借助 InstructLab,各領域的專家可以貢獻他們的技能和知識,既可用於內部開發,也可用於幫助上游社群創建一個共享且廣泛可用的開源 AI 模型。
Granite 3.0 系列模型涵蓋了廣泛的 AI 應用場景,從程式碼生成到自然語言處理,再到從大型資料集中提取洞見,所有這些都基於寬鬆的開源授權協議。我們幫助 IBM 研究院將 Granite 系列程式碼模型引入開源領域,並將繼續為該系列模型提供支持,既包括開源方面的支持,也包括作為 Red Hat AI 產品的一部分。
DeepSeek 近期發布的公告所引發的連鎖反應表明,開源創新能夠對人工智慧產生深遠的影響,無論是在模型層面還是更廣泛的層面。顯然,人們對這家中國平台的做法有擔憂,尤其是其模型授權協議並未解釋模型的生成方式,凸顯了提高透明度的必要性。儘管如此,上述變革也強化了紅帽對人工智慧未來的願景:一個開放的未來,專注於更小巧、更優化、更開放的模型,這些模型可以根據特定企業數據用例進行定制,並可在混合雲的任何位置運行。
將人工智慧模型擴展到開源之外。
紅帽在開源人工智慧領域的工作遠不止於 InstructLab 和 Granite 系列模型,還涵蓋了實際使用和高效利用人工智慧所需的工具和平台。該公司積極推動技術項目和社區的發展,例如(但不限於):
● RamaLama ,一個旨在促進人工智慧模型本地管理和部署的開源專案;
● TrustyAI ,一個用於建立更負責任的 AI 工作流程的開源工具包;
● Climatik是一個致力於幫助人工智慧在能源消耗方面更永續的計畫;
● Podman AI Lab ,一個專注於促進開源 LLM 實驗的開發者工具包;
近期發布的 Neural Magic 拓展了企業對人工智慧的願景,使企業能夠將規模更小、優化程度更高的 AI 模型(包括已獲許可的開源系統)與其數據進行整合,無論這些數據位於混合雲的哪個位置。 IT 部門隨後可以使用vLLM,利用這些模型驅動決策和生產,從而建立基於透明且受支援的技術的 AI 堆疊。
對企業而言,開源人工智慧的命脈在於混合雲。混合雲提供了必要的靈活性,能夠為每個人工智慧工作負載選擇最佳環境,從而優化效能、成本、規模和安全需求。紅帽的平台、目標和組織架構,以及產業合作夥伴、客戶和開源社區,都為推動人工智慧領域的開源發展提供了支援。
人工智慧領域擁有巨大的開放協作潛力。紅帽公司展望的未來是模型及其訓練過程的透明化。無論是在下週、下個月(甚至鑑於人工智慧的快速發展,可能更早),公司和整個開放社群都將繼續支持並積極參與人工智慧領域的民主化和開放化進程。

