人工智能 umjetna inteligencija (AI) 的概念并非新生事物,但相关技术的最新进展已使其成为我们日常使用的工具。AI日益增长的重要性和普及性既令人兴奋,同时也可能令人担忧,因为许多AI平台和功能的基础本质上是由少数强大公司控制的"黑匣子"。.
像红帽这样的大型组织认为, 每个人都应具备为AI做出贡献的能力。. AI的创新不应局限于那些能够负担巨额处理能力成本并拥有必要数据科学家来训练这些 大型语言模型 (LLMs)
的公司。相反,数十年的开源软件开发经验以及与社区的合作,使得每个人都能贡献于AI并从中受益,同时帮助塑造一个满足我们需求的未来。毫无疑问,开源方法是充分发挥AI潜力、使其更安全、更易获取和更民主化的唯一途径。.
什么是开源?
尽管术语“开源”最初指的是软件开发的一种方法论,但它已扩展至涵盖更广泛的工作方式——开放的、去中心化的和深度协作的。开源运动如今已远远超越软件世界, 开源的工作方式 已被全球范围内的协作努力所采纳,包括科学、教育、政府、制造、医疗等众多领域。.
开源文化拥有一些 核心原则和价值观, 使其有效且有意义,例如:
- 协作参与
- 责任共担
- 开放交流
- 精英管理与包容性
- 社区导向的开发
- 开放协作
- 自我组织
- 尊重与互惠
当开源原则成为协作努力的基础时,历史表明,非凡的成就是可能的。一些重要的例子包括:从 Linux 作为世界上最强大、最普及的操作系统的开发与普及,到 Kubernetes 和容器的兴起与发展,乃至互联网本身的开发与扩张。.
AI时代的六大开源优势
通过开源开发技术有无数的好处,但有六大优势尤为突出。.
1. 提升创新速度
当技术以协作和开放的方式开发时,创新和发现可以比封闭的组织和专有解决方案快得多。.
当工作成果被公开分享,并且他人能够在此基础上进行构建时,团队可以节省大量的时间和精力,因为他们无需从零开始。新的想法可以扩展之前的项目。这不仅节省了时间和金钱,而且通过更多人协同工作以解决问题、分享 Uvidi 和相互评审工作成果,从而强化了最终成果。.
一个更广泛、更协作的社区能够简单地达成更多目标:汇聚人才、连接专业技能,以比孤立的小团体更快、更有效地解决复杂问题和进行创新。.
2. 民主化访问
开源也使得获取新的AI技术民主化。当研究、代码和工具被公开共享时,有助于消除通常限制获取尖端创新的一些障碍。.
O InstructLab 是这一理念的一个绝佳范例。该倡议是一个独立于模型的开源AI项目,它简化了向LLMs贡献技能和知识的过程。此项努力的目标是让任何人都能帮助塑造 生成式AI (gen AI),包括那些通常不具备所需数据科学技能和培训的人。这使得更多的个人和组织能够可靠地为LLMs的训练和改进做出贡献。.
3. 增强的安全性与隐私性
由于开源项目降低了准入门槛,一个更大、更多样化的贡献者群体能够帮助识别和解决AI模型在开发过程中可能存在的潜在安全挑战。.
用于训练和微调AI模型的大部分数据和方法都是封闭的,由专有逻辑所掌控。这些组织外部的人员很少能够深入了解这些算法的工作原理,以及它们是否包含任何潜在危险数据或固有偏见。.
然而,如果一个模型及其训练数据是开放的,任何感兴趣的人都可以对其进行检查,从而降低安全风险并最小化平台偏见。此外,秉持开放理念的贡献者可以创建工具和流程来追踪和审计模型及应用程序的未来发展,从而能够监控不同解决方案的开发情况。.
这种开放性和透明度也 建立信任,, 因为用户有可能直接检查他们的数据是如何被使用和处理的,从而可以验证他们的隐私和数据主权是否得到尊重。此外,企业也可以通过使用像InstructLab这样的开源项目来创建他们自己严格控制的、经过微调的模型,从而保护其私有的、机密的或专有的信息。.
4. 提供灵活性与选择自由
尽管单体式、专有的、"黑匣子"式的LLMs是大多数人对生成式AI的认知和印象,但我们正开始看到一股日益增长的推动力,转向更小、独立的、为特定目的开发的AI模型。.
这些 小型语言模型 (SLMs) 通常在更小的数据集上进行训练以赋予其基本功能,然后使用特定领域的知识和数据进一步针对特定用例进行适配。.
这些SLMs比它们的大型同类模型显著更高效,并且在其预期用途上表现出相同(甚至更好)的性能。它们在训练和部署上更快、更高效,并且可以根据需要进行定制和调整。.
InstructLab项目的创建很大程度上就是为了实现这一点。通过它,您可以选取一个较小的开源AI模型,并使用您想要的任何额外数据和训练来扩展它。.
例如,您可以使用InstructLab创建一个高度定制化、为特定目的开发的客户服务聊天机器人,利用组织内部的最佳实践。这使得您能够实时地为全球各地的所有人提供您最佳的客户服务体验。.
最重要的是,这使您能够避免被单一供应商锁定,并在部署AI模型及基于其构建的任何应用程序的地点和方式方面提供灵活性。.
5. 赋能充满活力的生态系统
在开放社区中,“无人能独自创新“,这一信念自社区成立之初便已确立。.
这一理念在AI时代对于开源解决方案的领导者红帽而言依然适用,红帽将以 Red Hat AI,的形式提供多种开源工具和框架,合作伙伴将利用该解决方案为最终客户创造更多价值。.
单一供应商无法提供组织所需的一切,甚至无法跟上当前技术发展的速度。开源的原则和实践通过促进项目与行业间的伙伴关系与协作机会,加速了创新并催生了充满活力的生态系统。.
6. 降低成本
在2025年初,, 据估计 美国数据科学家的平均基本工资将超过125,000美元,经验更丰富的数据科学家的收入可能远高于此。.
显然,市场对掌握人工智能的数据科学家有着巨大且不断增长的需求,但很少有公司对吸引和留住他们所需的专业人才抱有太大希望。.
而构建、训练、维护和部署真正大型的LLMs成本极其高昂,需要整仓库装满高度优化(且非常昂贵)的计算设备和大量的存储空间。.
为特定目的和AI应用构建的、更小的开放模型,其构建、训练和部署效率显著更高。它们不仅只需要大型语言模型的一小部分计算能力,而且像InstructLab这样的项目使得没有专业技能和经验的人也能积极有效地为AI模型的训练和微调做出贡献。.
显然,开源为AI开发带来的成本节约和灵活性,对于希望利用AI应用获得竞争优势的中小企业是有益的。.
总之
为了构建民主和开放的人工智能,利用那些使云计算、互联网、Linux以及众多其他强大且极具创新性的开放技术成为可能的开源原则至关重要。.
这就是Red Hat正在采取的实现AI及其他相关工具的路径。所有人都应受益于人工智能的发展,因此,所有人都应能帮助决定和塑造其发展轨迹,并为其发展做出贡献。协作创新和开源对于该学科的未来不仅是必不可少的,更是无法绕开的。.

