全球MLOps(机器学习运营)市场,即帮助数据科学家简化和优化机器学习部署流程的解决方案,到2030年将实现年均近45%的增长。 预测由调研公司Valuates Reports进行,该公司估计2023年该细分市场的估值将从1.864亿美元跃升至36亿美元。 该市场升温的主要原因之一可能在于预测模型开发周期的缩短。 评估由Datarisk公司的首席数据科学家卡洛斯·雷尔瓦斯(Carlos Relvas)进行,该公司专注于利用人工智能在“价值创造”概念中发挥作用决策即服务”。
据他说,使用传统方法开发类似系统,组织平均需要两到三周,具体取决于行业的复杂程度。
“另一方面,当使用 MLOps 时,数据科学家可以自动化整个创作过程。首先,它通过自动机器学习进行所有模型训练,测试算法以查看哪种算法效果最好。此时,科学家如果愿意的话还可以上传他已有的代码并保存所有文档和所有代码,从而确保所有数据库文档的保护。 MLOps 的成功在于它消除了所有这些步骤,模型创建者本人负责并且拥有从项目开始到结束所需的一切”,他表示。
在2024年,Datarisk向市场推出了一款专注于满足在信贷授予、欺诈风险、工作变动倾向、农业生产力等领域的企业的MLOps解决方案。 仅在今年上半年,该工具已被使用进行超过一千万次查询,用户从中获得的最大益处之一就是显著节省了时间。 使用初创公司的MLOps后,原本平均三周的时间缩短到几个小时。
Carlos Relvas 还解释说,在完成第一阶段的培训后,Datarisk 的 MLOps 平台内会进入第二个阶段,即科学家可以自动自行创建 API,使模型能够在外部环境中使用。 第三阶段,他认为是解决方案的管理。 在这个阶段,目标是确保已开发、训练并正在使用的模型在一段时间内仍然保持良好的性能。 “该工具能够监控您的应用程序的使用情况以及API的运行情况,不仅确保一切按计划运行,还允许评估模型的质量。该解决方案可以验证,例如,是否有变量随时间发生变化,并在模型性能下降时向最终用户发出警报,”他说。
市场的接受度和 Datarisk 所预测的前景使得该公司预计到 2025 年底该解决方案的使用量将增长五倍以上。
Datarisk的联合创始人兼CEO Jhonata Emerick解释说,作为巴西首家提供MLOps概念解决方案的先驱,这家初创公司正在实施成熟和完善其主要商业论点的战略。 “我们更深入地了解市场的需求,现在我们已准备好提供能够以绝对相关的方式改变国内数据科学现状的解决方案,”他说。
Emerick 表示,在开发预测模型的具体情况下,MLOps 解决方案是为了应对缓慢的内部流程而出现的,这种解决方案是为公司不需要以当前所需的灵活性来管理数据区域而设计的。
“通常采用 IT 队列系统,其中数据科学领域完成模型创建并将其传递给工程领域以创建 API。反过来,这将花费大量时间来完成其部分工作,然后它将把项目传递给信用引擎团队,例如,以便它最终能够实现这个 API,这将导致其他截止日期。结果是,当模型实施的时候,情况就不同了。这就是为什么 MLOps 解决方案在优化方面如此有效的原因,”他总结道。