ホーム記事AIオープンソース:Red Hatの視点

オープンソースAI:Red Hatの視点

30年以上前、レッドハットはオープンソース開発とライセンスが、より優れたソフトウェアの開発とITイノベーションの促進に繋がる可能性を見出しました。3,000万行ものコードを経て、Linuxは最も成功したオープンソースソフトウェアへと進化を遂げ、今日に至るまでその地位を維持しています。オープンソース原則へのコミットメントは、企業のビジネスモデルだけでなく、企業文化にも浸透し続けています。レッドハットは、これらの概念は正しく実行されれば人工知能(AI)にも同様の影響を与えると考えていますが、テクノロジー業界では「正しい方法」とは何かについて意見が分かれています。

AI、特に生成AI(gen AI)を支える大規模言語モデル(LLM)は、オープンソースプログラムと同じように考えることはできません。ソフトウェアとは異なり、AIモデルは主に数値パラメータモデルで構成されており、入力データの処理方法や様々なデータポイント間の接続方法を決定します。学習済みモデルのパラメータは、膨大な量の学習データを慎重に準備、混合、処理する長いプロセスの結果です。

モデルパラメータはソフトウェアではありませんが、ある意味ではコードに似た機能を持っています。データをモデルのソースコード、あるいはそれに非常に近いものと比較するのは簡単です。オープンソースでは、ソースコードは一般的にソフトウェアに変更を加えるための「推奨される方法」と定義されています。トレーニングデータだけではこの機能は適用できません。トレーニングデータはサイズが変動しやすく、事前トレーニングのプロセスが複雑であるため、トレーニングで使用されるデータ項目とトレーニング済みパラメータ、そして結果として得られるモデルの挙動との関連性は希薄で間接的なものとなるからです。

現在コミュニティで行われているAIモデルの改良や機能強化のほとんどは、元の学習データへのアクセスや操作を伴いません。むしろ、モデルパラメータの変更、あるいはモデルのパフォーマンスを微調整する可能性のあるプロセスや調整によって実現されています。こうしたモデルの改良を自由に行うには、オープンソースライセンスの下でユーザーが享受するすべての権限を付与した上でパラメータを公開する必要があります。

Red Hat のオープンソース AI に対するビジョン。

Red Hatは、オープンソースAIの基盤は、オープンソースライセンスのモデルパラメータとオープンソースソフトウェアコンポーネントの組み合わせ。これはオープンソースAIの出発点であり、その理念の最終的な到達点ではありません。Red Hatは、オープンソースコミュニティ、規制当局、そして業界に対し、AIモデルのトレーニングとチューニングにおいて、透明性の向上とオープンソース開発原則への適合を目指し、継続的に努力することを推奨します。

これは、オープンソースソフトウェアのエコシステムを包含し、オープンソースAIを実践的に活用できる企業としてのRed Hatのビジョンです。Open Source Initiative Open Source AI Definition で策定している。これは、オープンソースAIを可能な限り幅広いコミュニティ、組織、ベンダーにとって実現可能かつアクセスしやすいものにするための、Red Hatのビジョンです。

この視点は、オープンソースコミュニティとの連携を通じて実践されています。特にInstructLabGraniteライセンス・オープンソースモデル・ファミリーの取り組みが顕著です。InstructLabは、データサイエンティスト以外の人々がAIモデルを提供する際の障壁を大幅に低減します。InstructLabを活用することで、あらゆる分野のドメインエキスパートが、社内利用だけでなく、上流コミュニティ向けに共有され、広くアクセス可能なオープンソースAIモデルの作成にも、自身のスキルと知識を加えることができます。

洞察抽出まで、幅広いAIユースケースに対応しており、すべて寛容なオープンソースライセンスの下で提供されています。私たちはIBM ResearchがGraniteコードモデルファミリーをオープンソースの世界に導入するのを支援し、オープンソースの観点からも、Red Hat AI製品の一部としても、このモデルファミリーのサポートを継続しています。

DeepSeekの最近の発表がもたらした影響は、オープンソースのイノベーションがモデルレベルだけでなく、それ以外のレベルでもAIにどのような影響を与えるかを示しています。この中国プラットフォームのアプローチには懸念があり、特にモデルのライセンスにその作成方法が明記されていないことが懸念材料となっています。これは透明性の必要性を改めて示すものです。しかしながら、前述のような混乱は、Red HatのAIの未来に対するビジョンを強固なものにしています。それは、ハイブリッドクラウド内のあらゆる場所で、特定のエンタープライズデータユースケースに合わせてカスタマイズできる、より小規模で最適化されたオープンなモデルに焦点を当てた、オープンな未来です。

オープンソースを超えて AI モデルを拡張します。

Red HatのオープンソースAI分野における取り組みは、InstructLabやGraniteファミリーのモデルにとどまらず、AIを実際に利用し、生産的に活用するために必要なツールやプラットフォームにまで及びます。同社は、以下のような技術プロジェクトやコミュニティの育成に積極的に取り組んでいます(ただし、これらに限定されるものではありません)。

RamaLama は、AI モデルのローカル管理と展開を容易にすることを目的としたオープンソース プロジェクトです。

TrustyAI :より責任ある AI ワークフローを構築するためのオープンソース ツールキット

Climatik は、エネルギー消費に関して AI をより持続可能にすることを支援することに重点を置いたプロジェクトです。

Podman AI Lab 、オープンソース LLM の実験を容易にすることに重点を置いた開発者ツールキット。

最近の発表は、 AIに対する企業のビジョンを拡大し、企業がハイブリッドクラウド内のどこに保存されているかに関わらず、ライセンス供与されたオープンソースシステムを含む、より小規模で最適化されたAIモデルを自社データと連携させることを可能にします。IT組織はvLLMこれらのモデルから意思決定とデータ生成を促し、透明性とサポート性を備えたテクノロジーに基づくAIスタックの構築を支援します。

企業にとって、オープンソースAIはハイブリッドクラウドでこそ活かされます。ハイブリッドクラウドは、AIワークロードごとに最適な環境を選択するために必要な柔軟性を提供し、パフォーマンス、コスト、スケール、そしてセキュリティ要件を最適化します。Red Hatのプラットフォーム、目標、そして組織は、業界のパートナー、お客様、そしてオープンソース・コミュニティと共に、人工知能におけるオープンソースの推進を支え、これらの取り組みを支援します。

AI分野におけるこのオープンなコラボレーションを拡大する大きな可能性を秘めています。Red Hatは、モデルとそのトレーニングにおける透明性のある作業を実現する未来を思い描いています。来週であろうと来月であろうと(あるいはAIの急速な進化を考えると、もっと早くに)、Red Hatとオープンコミュニティ全体は、AIの世界を民主化しオープン化するための取り組みを継続的に支援し、支持していきます。

関連記事

返信を残す

コメントを入力してください。
ここに名前を入力してください。

最近の

最も人気のある

[elfsight_cookie_consent id="1"]