首页文章人工智能开源:红帽的视角

开源人工智能:红帽的观点

三十多年前,红帽公司就看到了开源开发和许可的巨大潜力,它能够创造更优质的软件,并促进IT创新。如今,Linux已经积累了三千万行代码,不仅发展成为最成功的开源软件,而且至今仍保持着这一地位。红帽公司对开源原则的承诺不仅体现在其企业商业模式中,也融入了企业文化。公司认为,如果运用得当,这些理念对人工智能(AI)同样具有深远的影响,但对于何为“正确”的做法,科技界仍存在分歧。

人工智能,尤其是生成式人工智能(gen AI)背后的大型语言模型(LLM),不能像开源程序那样看待。与软件不同,人工智能模型主要由数值参数模型构成,这些参数决定了模型如何处理输入,以及它在各个数据点之间建立的联系。训练模型的参数是经过漫长过程的结果,该过程涉及大量经过精心准备、混合和处理的训练数据。

尽管模型参数并非软件,但在某些方面它们的作用类似于代码。我们可以很容易地将数据与模型的源代码(或与其非常接近的某种形式)进行比较。在开源软件领域,源代码通常被定义为修改软件的“首选方式”。然而,仅凭训练数据本身并不符合这一概念,因为训练数据的大小不一,而且预训练过程十分复杂,导致任何用于训练的数据项与训练后的参数以及模型的最终行为之间的联系都十分薄弱且间接。

目前社区中大多数针对人工智能模型的改进和增强并不涉及访问或篡改原始训练数据。相反,它们源于对模型参数的修改,或通过某种流程或调整来微调模型性能。要实现这些模型改进,就必须以开源许可协议赋予用户的所有权限来发布模型参数。

红帽对开源人工智能的愿景。

红帽认为,开源人工智能的基础在于开源许可的模型参数与开源软件组件的结合。这只是开源人工智能的起点,而非其最终目标。红帽鼓励开源社区、监管机构和行业在训练和调优人工智能模型时,继续努力提高透明度,并更加遵循开源开发原则。

这是红帽公司作为一家涵盖开源软件生态系统并能切实参与开源人工智能的公司的愿景。这并非像开源促进会(OSI) 正在制定的开源人工智能定义(OSAID) 那样,试图给出正式的定义。这代表了红帽公司对于如何使开源人工智能切实可行并惠及尽可能多的社区、组织和供应商的看法。

这种理念通过与开源社区的合作得以实践,其中最突出的例子是红帽公司牵头的InstructLab开发的 Granite 系列授权开源模型。InstructLab 显著降低了非数据科学家贡献 AI 模型的门槛。借助 InstructLab,各领域的专家可以贡献他们的技能和知识,既可用于内部开发,也可用于帮助上游社区创建一个共享且广泛可用的开源 AI 模型。

Granite 3.0 系列模型涵盖了广泛的 AI 应用场景,从代码生成到自然语言处理,再到从大型数据集中提取洞见,所有这些都基于宽松的开源许可协议。我们帮助 IBM 研究院将 Granite 系列代码模型引入开源领域,并将继续为该系列模型提供支持,既包括开源方面的支持,也包括作为 Red Hat AI 产品的一部分。

DeepSeek 近期发布的公告所引发的连锁反应表明,开源创新能够对人工智能产生深远的影响,无论是在模型层面还是更广泛的层面。显然,人们对这家中国平台的做法存在担忧,尤其是其模型许可协议并未解释模型的生成方式,这凸显了提高透明度的必要性。尽管如此,上述变革也强化了红帽对人工智能未来的愿景:一个开放的未来,专注于更小巧、更优化、更开放的模型,这些模型可以根据特定企业数据用例进行定制,并可在混合云的任何位置运行。

将人工智能模型扩展到开源之外。

红帽在开源人工智能领域的工作远不止于 InstructLab 和 Granite 系列模型,还涵盖了实际使用和高效利用人工智能所需的工具和平台。该公司积极推动技术项目和社区的发展,例如(但不限于):

RamaLama ,一个旨在促进人工智能模型本地管理和部署的开源项目;

TrustyAI ,一个用于构建更负责任的 AI 工作流程的开源工具包;

Climatik是一个致力于帮助人工智能在能源消耗方面更加可持续的项目;

Podman AI Lab ,一个专注于促进开源 LLM 实验的开发者工具包;

近期发布的 Neural Magic 拓展了企业对人工智能的愿景,使企业能够将规模更小、优化程度更高的 AI 模型(包括已获许可的开源系统)与其数据进行整合,无论这些数据位于混合云的哪个位置。IT 部门随后可以使用vLLM,利用这些模型驱动决策和生产,从而构建基于透明且受支持的技术的 AI 堆栈。

对于企业而言,开源人工智能的命脉在于混合云。混合云提供了必要的灵活性,能够为每个人工智能工作负载选择最佳环境,从而优化性能、成本、规模和安全需求。红帽的平台、目标和组织架构,以及行业合作伙伴、客户和开源社区,都为推动人工智能领域的开源发展提供了支持。

人工智能领域拥有巨大的开放协作潜力。红帽公司展望的未来是模型及其训练过程的透明化。无论是在下周、下个月(甚至鉴于人工智能的快速发展,可能更早),公司和整个开放社区都将继续支持并积极参与人工智能领域的民主化和开放化进程。

相关文章

发表评论

请输入您的评论!
请在此处输入您的姓名。

最近的

最受欢迎

[elfsight_cookie_consent id="1"]