글로벌 MLOps(머신러닝 운영) 시장은 데이터 과학자들이 머신러닝 배포 과정을 간소화하고 최적화하는 데 도움을 주는 솔루션으로, 2030년까지 연평균 거의 45%의 성장률을 기록할 것입니다. 이 전망은 조사 회사인 Valuates Reports가 작성했으며, 2023년에 달성된 1억 8640만 달러에서 36억 달러로 해당 부문의 가치가 급증할 것으로 예상됩니다. 이 시장의 온난화의 주요 원인 중 하나는 예측 모델 개발 기간의 단축에 있을 수 있습니다. 평가는 Datarisk의 최고 데이터 과학자인 Carlos Relvas가 수행했으며, Datarisk는 인공지능을 활용하여 가치를 창출하는 데 특화된 회사입니다.서비스로서의 결정
그에 따르면, 전통적인 방법으로 유사한 시스템을 개발하는 데 조직은 부서의 복잡성에 따라 평균 2주에서 3주 정도 걸린다고 합니다.
반면에, MLOps를 사용할 때 데이터 과학자는 전체 생성 과정을 자동화할 수 있습니다. 먼저, 자동 머신러닝을 통해 알고리즘을 테스트하여 어떤 것이 가장 잘 작동하는지 확인하는 모델 훈련 과정을 수행합니다. 이때, 데이터 과학자는 원한다면 자신이 이미 가지고 있는 코드를 업로드하고 모든 문서와 코드를 저장하여 모든 데이터베이스 문서의 보호를 보장할 수도 있습니다. MLOps의 성공은 이러한 모든 단계를 제거하고, 모델의 제작자가 책임지고 프로젝트의 시작부터 끝까지 필요한 모든 것을 갖추고 있기 때문에 가능합니다,”라고 말했습니다.
2024년, Datarisk는 신용 대출, 사기 위험, 이직 가능성, 농업 생산성 등과 같은 활동에서 주도적인 기업들을 대상으로 하는 MLOps 솔루션을 시장에 출시했습니다. 올해 상반기 동안에만 이 도구는 1천만 건이 넘는 조회를 수행하는 데 사용되었으며, 이 기술을 사용하는 사용자들이 얻은 이점 중 가장 큰 것 중 하나는 바로 시간 절약이었습니다. 스타트업의 MLOps 덕분에 평균 소요 기간이 3주에서 몇 시간으로 단축되었습니다.
카를로스 레르바스는 또한 이 첫 번째 훈련이 완료된 후, 다타리스크의 MLOps 플랫폼 내에서 두 번째 단계가 시작된다고 설명하는데, 이 단계에서는 과학자가 직접 자동으로 API를 생성하여 외부 환경에서 모델을 사용할 수 있게 된다고 합니다. 세 번째 단계는 그에 따르면 해결책의 관리입니다. 이 단계에서는 개발되고 훈련된 이 모델이 시간이 지나도 계속 좋은 성능을 유지하도록 하는 것이 목표입니다. "이 도구는 애플리케이션 사용량과 API 작동 상태를 모두 모니터링할 수 있어 모든 것이 계획대로 작동하는지 확인할 뿐만 아니라 모델의 품질 평가도 가능하게 합니다. 이 솔루션은 예를 들어, 시간이 지남에 따라 변경된 변수 여부를 검증하고, 모델 성능이 저하될 경우 최종 사용자에게 경고를 발송하는 기능을 제공합니다."
시장 수용력과 Datarisk가 수행한 전망은 회사가 2025년 말까지 이 솔루션의 사용량이 5배 이상 증가할 것으로 예상할 수 있게 합니다.
Datarisk의 공동 창립자이자 CEO인 Jhonata Emerick는 브라질에서 MLOps 개념의 솔루션을 선도하는 선구자가 됨으로써 스타트업이 주요 비즈니스 가설을 성숙시키고 개선하는 전략을 실천하고 있다고 설명합니다. 우리는 시장의 부족한 점을 더 깊이 이해하고 있으며, 이제는 국가의 데이터 과학 현실을 전혀 의미 있게 변화시킬 수 있는 솔루션을 제공할 준비가 되어 있다고 말합니다.
에머릭에 따르면, 예측 모델 개발의 특정 사례에서 MLOps 솔루션은 현재 요구되는 민첩성으로 데이터 분야를 관리할 필요가 없었던 시기에 설계된 느린 내부 프로세스에 대한 대응으로 등장합니다.
일반적으로 데이터 과학 분야가 모델을 완성하면 엔지니어링 팀이 API를 생성하는 IT 작업 대기열 시스템이 채택됩니다. 이 팀은 상당한 시간을 소요하여 자신의 역할을 수행한 후, 예를 들어 신용 엔진 팀에 프로젝트를 넘기면, 그 팀이 최종적으로 API를 구현하는 데 또 다른 기한이 걸립니다. 그 결과, 모델이 구현될 때쯤에는 상황이 이미 달라져 있습니다. 그래서 MLOps 솔루션이 최적화 측면에서 매우 효과적이 되는 것입니다.