> 기사 > AI > 오픈 소스: 레드햇의 관점

오픈 소스 AI: 레드햇의 관점

30여 년 전, 레드햇은 오픈 소스 개발과 라이선싱이 더 나은 소프트웨어를 만들고 IT 혁신을 촉진할 수 있는 잠재력을 가지고 있다고 보았습니다. 3천만 줄이 넘는 코드로 이루어진 리눅스는 가장 성공적인 오픈 소스 소프트웨어로 성장했을 뿐만 아니라, 오늘날까지도 그 자리를 유지하고 있습니다. 오픈 소스 원칙에 대한 헌신은 기업 비즈니스 모델뿐 아니라 기업 문화의 일부로서도 지속되고 있습니다. 레드햇은 이러한 개념들이 인공지능(AI) 분야에도 올바르게 적용될 경우 동일한 효과를 가져올 수 있다고 판단하지만, 기술 업계에서는 '올바른 방식'이 무엇인지에 대해 의견이 분분합니다.

인공지능, 특히 생성형 인공지능(gen AI)의 기반이 되는 대규모 언어 모델(LLM)은 오픈 소스 프로그램과 같은 방식으로 볼 수 없습니다. 소프트웨어와 달리 인공지능 모델은 주로 모델이 입력을 처리하는 방식과 다양한 데이터 포인트 간의 연결을 결정하는 수치적 매개변수 모델로 구성됩니다. 학습된 모델의 매개변수는 방대한 양의 학습 데이터를 신중하게 준비하고, 조합하고, 처리하는 오랜 과정을 거쳐 만들어집니다.

모델 매개변수는 소프트웨어는 아니지만, 어떤 면에서는 코드와 유사한 기능을 합니다. 데이터를 모델의 소스 코드, 또는 소스 코드와 매우 유사한 무언가와 비교하는 것은 쉽습니다. 오픈 소스 분야에서 소스 코드는 일반적으로 소프트웨어를 수정하는 "권장되는 방식"으로 정의됩니다. 하지만 훈련 데이터 자체는 크기가 다양하고 복잡한 사전 훈련 과정을 거치기 때문에 이러한 기능을 완벽하게 수행하지 못합니다. 훈련에 사용된 데이터 항목 하나하나가 훈련된 매개변수 및 모델의 결과적인 동작과 미약하고 간접적인 연관성을 가지기 때문입니다.

현재 커뮤니티에서 이루어지고 있는 AI 모델 개선 및 향상 작업의 대부분은 원본 학습 데이터에 접근하거나 조작하는 것을 포함하지 않습니다. 오히려 모델 매개변수를 수정하거나 모델 성능을 미세 조정하는 과정을 통해 이루어집니다. 이러한 모델 개선을 자유롭게 진행하려면 오픈 소스 라이선스에 따라 사용자가 부여받는 모든 권한과 함께 매개변수를 공개해야 합니다.

레드햇의 오픈 소스 AI에 대한 비전.

레드햇은 오픈 소스 AI의 기반이 오픈 소스 라이선스가 적용된 모델 파라미터와 오픈 소스 소프트웨어 구성 요소의 결합 . 이는 오픈 소스 AI의 출발점일 뿐, 궁극적인 목표는 아닙니다. 레드햇은 오픈 소스 커뮤니티, 규제 당국, 그리고 업계가 AI 모델 학습 및 튜닝 과정에서 더욱 투명하고 오픈 소스 개발 원칙에 부합하도록 지속적으로 노력할 것을 권장합니다.

이는 오픈 소스 소프트웨어 생태계를 포괄하고 오픈 소스 AI와 실질적으로 협력할 수 있는 기업으로서 레드햇의 비전입니다. 이는 오픈 소스 이니셔티브 (OSI)가 개발 중인 오픈 소스 AI 정의 (OSAID)와 같은 공식적인 정의를 시도하는 것이 아닙니다. 오히려 레드햇이 생각하는 오픈 소스 AI를 최대한 많은 커뮤니티, 조직 및 벤더가 활용하고 접근할 수 있도록 만드는 방법에 대한 관점입니다.

InstructLab IBM 리서치와 협력하여 개발한 라이선스 오픈 소스 모델 제품군인 Granite를 비롯한 오픈 소스 커뮤니티와의 협업을 통해 실현되고 있습니다 . InstructLab은 데이터 과학자가 아닌 사람들도 AI 모델 개발에 참여할 수 있도록 장벽을 크게 낮춰줍니다. InstructLab을 통해 모든 분야의 전문가들은 자신의 기술과 지식을 활용하여 내부적으로 사용하거나, 상위 커뮤니티를 위한 공유 가능하고 널리 사용 가능한 오픈 소스 AI 모델을 구축하는 데 기여할 수 있습니다.

인사이트 추출에 이르기까지 광범위한 AI 사용 사례를 지원하며 , 모두 관대한 오픈 소스 라이선스 하에 제공됩니다. 저희는 IBM 리서치가 Granite 코드 모델 제품군을 오픈 소스로 공개하도록 지원했으며, 오픈 소스 관점과 Red Hat AI 제품의 일부로서 해당 모델 제품군을 지속적으로 지원하고 있습니다.

최근 DeepSeek의 발표가 불러일으킨 파장은 오픈 소스 혁신이 모델 수준뿐 아니라 그 이상에서도 AI에 얼마나 큰 영향을 미칠 수 있는지를 보여줍니다. 물론 중국 플랫폼의 접근 방식, 특히 모델 라이선스에 생성 방식이 명시되어 있지 않아 투명성 확보의 필요성이 더욱 강조되는 점에 대한 우려가 있습니다. 하지만 이러한 변화는 Red Hat이 구상하는 AI의 미래, 즉 하이브리드 클라우드 내 어디에서든 특정 기업 데이터 사용 사례에 맞게 맞춤 설정할 수 있는, 더 작고 최적화된 개방형 모델에 초점을 맞춘 개방적인 미래를 더욱 공고히 합니다.

오픈소스를 넘어 AI 모델을 확장합니다.

레드햇의 오픈소스 AI 분야 활동은 InstructLab과 Granite 모델 제품군을 훨씬 뛰어넘어, AI를 실제로 활용하고 생산적으로 사용하는 데 필요한 도구와 플랫폼까지 확장됩니다. 레드햇은 다음과 같은 (이에 국한되지는 않지만) 기술 프로젝트 및 커뮤니티 육성에 매우 적극적으로 나서고 있습니다.

RamaLama는 AI 모델의 로컬 관리 및 배포를 용이하게 하는 것을 목표로 하는 오픈 소스 프로젝트입니다.

TrustyAI는 보다 책임감 있는 AI 워크플로우 구축을 위한 오픈 소스 툴킷입니다.

클리마틱(Climatik)은 에너지 소비 측면에서 AI의 지속가능성을 높이는 데 중점을 둔 프로젝트입니다.

Podman AI Lab은 오픈 소스 LLM을 활용한 실험을 용이하게 하는 데 초점을 맞춘 개발자 툴킷입니다.

최근 발표된 뉴럴 매직(Neural Magic)은 기업의 AI 비전을 확장하여, 기업들이 하이브리드 클라우드 어디에 있든 라이선스가 부여된 오픈 소스 시스템을 포함한 더욱 작고 최적화된 AI 모델을 데이터에 맞춰 활용할 수 있도록 지원합니다. IT 조직은 vLLM 이러한 모델을 기반으로 의사 결정 및 프로덕션을 진행하고, 투명하고 지원되는 기술 기반의 AI 스택을 구축할 수 있습니다.

레드햇에게 있어 오픈소스 AI는 하이브리드 클라우드 환경에서 생동감 넘치게 살아 숨 쉽니다. 하이브리드 클라우드는 각 AI 워크로드에 가장 적합한 환경을 선택할 수 있는 유연성을 제공하여 성능, 비용, 확장성 및 보안 요구 사항을 최적화합니다. 레드햇의 플랫폼, 목표 및 조직은 업계 파트너, 고객 및 오픈소스 커뮤니티와 함께 ​​이러한 노력을 지원하며, 인공지능 분야의 오픈소스 혁신을 가속화하고 있습니다.

AI 분야에서 이러한 개방형 협업을 확대할 수 있는 잠재력은 엄청납니다. 레드햇은 모델 개발 및 학습 과정이 투명하게 이루어지는 미래를 꿈꿉니다. 다음 주든 다음 달이든 (AI의 빠른 발전 속도를 고려하면 더 빨리라도), 레드햇과 오픈 커뮤니티 전체는 AI의 민주화와 개방을 위한 노력을 지속적으로 지원하고 수용할 것입니다.

관련 기사

댓글 남기기 댓글

댓글을 입력해 주세요!
여기에 이름을 입력하세요.

최근의

가장 인기 있는

[elfsight_cookie_consent id="1"]