loading...

딥시크(DeepSeek)가 촉발한 AI 시장의 지각 변동

이 글은 IDG의 아티클을 전재하여 제공합니다.
[원문보기]

새로운 생성형 AI 모델의 등장으로 시장 경쟁이 치열해지고, 비용이 절감될 가능성이 대두되고 있습니다. 또한, 파괴적 혁신이 증가할 수도 있습니다. 중국의 AI 스타트업 딥시크(DeepSeek)가 공개한 오픈소스 버전 추론 모델 DeepSeek-R1의 충격파가 거세지고 있습니다. 이 스타트업은 자사의 모델이 오픈AI의 o1 GPT보다 성능이 우수하다고 주장하고 있습니다. 이 소식이 전해진 이후 엔비디아의 시가총액은 27일 6,000억 달러나 하락했습니다.

가트너에 따르면, 딥시크의 혁신적인 기술은 훨씬 낮은 비용의 하드웨어와 컴퓨팅 자원을 사용하면서도 다른 선도적 LLM과 비슷한 성능을 제공한다는 데 있습니다. IDC 소프트웨어 시장 조사 및 자문 실무의 그룹 부사장 겸 전 세계 AI, 자동화, 데이터 및 분석 리서치 부문 총괄인 리투 조티(Ritu Jyoti)는 “딥시크의 등장은 더 접근하기 쉽고 저렴한 AI 솔루션으로 이어질 수 있다. 그러나 전략적, 경쟁적, 품질 및 보안 요소를 신중하게 고려해야 한다”고 조언합니다.

해석의 여지가 있는

양자 기술, 인공지능, 디지털 R&D, 신기술을 주로 다루는 가트너의 부사장 애널리스트 치라그 데카테(Chirag Dekate)는 시장이 딥시크의 혁신에 대해 과잉 반응하고 있다고 생각합니다. “미지의 존재에 대한 감각적 반응들이 있다. 맹목적 애국주의(jingoism), 민족주의적 내러티브가 촉발되기도 한다. 이러한 내러티브는 상상력을 빠르게 자극한다. 그러나 세부 사항을 보면 헤드라인들의 문구만큼 자극적이지 않다.” 하리타 칸다바투(Haritha Khandabattu), 제레미 도인(Jeremy D'Hoinne), 리타 살람(Rita Sallam), 레이나르 라모스(Leinar Ramos), 아룬 찬드라세카란(Arun Chandrasekaran) 등 가트너의 연구원들은 리서치 노트에 “딥시크의 R1 모델은 중요한 변화를 나타내며, 생성형 AI의 미래가 단순한 계산력을 통한 확장이라는 기존 패러다임이 아닌, 혁신적이고 비용 효율적인 접근 방식에 있음을 시사한다.”고 기술했습니다.

IDC의 성능 집약적 컴퓨팅 및 전 세계 인프라 리서치 담당 부사장 피터 러튼(Peter Rutten)은 딥시크와 관련해 주목할 점이 있다며, AI가 더 크고, 더 많고, 더 빠른 아키텍처를 통해서만 개선될 수 있다는 이론에 기반한 현재의 AI 학습 접근 방식을 뒤흔든다고 했습니다. “AI 개발을 위한 알고리즘, 프레임워크, 소프트웨어에 대한 새로운 접근 방식은 더 낮은 인프라 비용으로 최신 버전의 챗GPT와 동등하거나 더 나은 결과를 제공한다. 이것은 AI 학습이 대규모 인프라 구축에 수십억 달러를 투자할 수 있는 하이퍼스케일러의 전유물이 될 필요가 없다는 것을 의미한다. 중소 규모의 AI 이니셔티브도 모델을 사용자 지정하거나 파인튜닝하는 것, 모델을 추론하는 등의 작업이 상당히 더 저렴해질 수 있다. 딥시크가 개발한 기술로 앞으로 AI 워크로드는 다른 워크로드만큼이 저렴해질 것이다.”라고 했습니다. 즉 딥시크의 접근 방식은 비용과 공간 측면에서 일반 기업도 대규모 AI 개발을 할 수 있음을 의미한다고 덧붙였습니다.

딥시크에 대한 깊은 관심

데카테는 딥시크 소식이 AI 혁신이 가속화되는 속도를 다시 한번 일깨워 주는 것이라고 생각하며, 기업들이 빠르게 생성형 AI에 참여하지 않으면 시대에 뒤떨어질 수 있음을 시사한다고 평했습니다. 지금 바로 뛰어들어 실험을 시작하고 생성형 AI 전략, 구현 및 배포 전략을 수립하느냐, 따라잡을 수 없을 정도로 뒤처지게 되느냐 두 가지 선택권이 있습니다. 딥시크가 현재의 생성형 AI 지형을 파괴하는 정도에 대해 시장이 과민하게 반응하고 있을 수 있습니다. 그러나 더 이상 기다릴 여유가 없다는 신호인 것은 분명합니다. 생성형 AI의 비용 벡터가 결국 더 효과적이고 더 접근하기 쉬워질 것임을 딥시크는 보여주고 있습니다.

IDC의 조티에 따르면, 마이크로소프트 리서치 아시아의 창립 이사이자 전 구글 차이나 사장인 시노베이션 벤처스의 회장 겸 CEO인 카이푸 리가 작년에 중국 AI 스타트업들이 효율성 창출에 집중할 것이라고 예측한 것에 주목하고 있습니다. “그들의 비결을 파헤쳐 보면, RL(강화 학습)과 그것을 어떻게 사용했는지에 대한 것이 분명하다. 대부분의 언어 모델은 사전 학습, 감독된 파인튜닝, 그리고 일부 RL을 조합하여 작업을 수행한다. 딥시크의 접근 방식은 LLM이 오로지 RL만으로 추론할 수 있음을 보여주었다.”

차별화

DeepSeek-R1은 DeepSeek-V3 기본 모델을 기반으로 하는 새로운 오픈 웨이트 LLM입니다. DeepSeek-R1-Zero는 RL을 통해서만 학습된 임시 모델입니다. 가트너에 따르면, 이는 모델 제공업체가 순수 RL(pure RL)을 사용하여 수학 및 코딩과 같이 답변을 생성하기 어렵지만, 검증하기 쉬운 특정 영역에서 기능을 향상시킬 수 있음을 입증했습니다.

그러나 가트너의 연구진은 딥시크 모델이 새로운 모델 패러다임을 대표하지 않는다고 했습니다. 기존의 LLM 학습 아키텍처를 기반으로 하며, 학습과 추론의 효율성을 높이기 위해 기술 및 아키텍처 최적화를 계층화했다고 볼 수 있습니다. 또한 딥시크가 모델 성능의 새로운 기준을 제시하지도 않습니다. 성능 측면에서 기존의 최신 모델과 일치하는 경우가 많지만 이를 능가하지는 않습니다. 따라서 딥시크가 하드웨어와 데이터를 추가 투입해 더 효율적인 모델을 확장하는 것이 더 효과적일 수 있습니다.

딥시크 R1 출시, 그리고 이 모델이 보여주는 오픈AI o1-프리뷰 모델 대비 획기적으로 낮은 추론 가격은 LLM 모델 계층의 광범위한 보급을 시사합니다. 더 이상 토큰당 비용으로 효율성을 살펴볼 일이 아니라는 의미이기도 합니다. 어떤 모델이 정확도와 대기 시간에 영향을 주지 않고 가장 저렴하게 추론할 수 있는지에 관한 것입니다. 따라서 머지않아 AI를 효율적으로 확장하는 것보다는 AI를 구축하기 위해 얼마나 많은 컴퓨팅을 조합할 수 있는 지에 초점이 맞춰질 것입니다.

딥시크 발표 이후 메타와 같은 다른 모델 구축업체들은 후속 계획을 숨가쁘게 수립하고 있습니다. 따라서 기업들은 중단기적으로 LLM의 비용과 가격이 급격히 하락하는 상황을 예상할 필요가 있습니다. 소프트웨어 및 알고리즘 중심의 혁신으로 인해 모델 공급업체는 더 강력한 하드웨어로 더 많은 작업을 수행할 수 있습니다. 그러나 첨단의 새 모델은 여전히 높은 R&D 및 컴퓨팅 비용을 요구할 것이며, 이는 얼리 어답터에게 전가될 것입니다.

IDC의 조티는 딥시크에 대한 5가지 핵심을 다음과 같이 제시합니다.

  • 비용 효율성: 딥시크의 AI 모델은 기존 모델에 비해 훨씬 저렴한 비용으로 높은 성능을 달성한다고 주장합니다. 이는 기업이 인프라와 하드웨어에 많은 투자를 하지 않아도 된다는 것을 의미합니다. 잠재적으로 고급 AI 기능에 대한 진입 장벽이 낮아질 수 있습니다.
  • 경쟁 환경: 딥시크가 오픈AI 및 메타와 같은 기존 AI 대기업의 강력한 경쟁자로 부상한 것은 AI 환경이 더욱 경쟁이 치열해지고 있음을 시사합니다. 이는 혁신을 촉진하고 기존 업체가 서비스를 개선하고 비용을 낮추도록 강요할 수 있습니다.
  • 오픈 웨이트 모델: 딥시크가 모델을 ‘오픈 웨이트'(open-weight)로 출시하기로 한 결정은 개발자와 연구자들이 기술에 액세스하고 이를 기반으로 구축할 수 있도록 합니다. 이러한 개방성은 AI 커뮤니티에서 보다 협력적인 환경을 조성하여 발전과 응용을 가속할 수 있습니다.
  • 전략적 재평가: 딥시크가 더 적은 데이터와 더 낮은 비용으로 고성능 AI를 달성할 수 있음을 입증한 만큼, AI 전략을 재평가해야 할 필요가 있습니다. 여기에는 현재 AI 인프라에 대한 투자를 평가하고 보다 비용 효율적인 대안을 고려하는 것이 포함됩니다.
  • 데이터 프라이버시 및 보안: 딥시크가 중국에 기반을 두고 있다는 점을 고려할 때 데이터 프라이버시 및 보안에 대한 우려가 있을 수 있습니다. 서로 다른 규제 환경에서 운영되는 기업의 기술을 통합하는 것이 어떤 영향을 미치는지 신중하게 고려해야 합니다.

포레스터의 수석 애널리스트 카를로스 카사노바(Carlos Casanova), 미셸 펠리노(Michele Pelino), 미셸 괴츠(Michele Goetz)는 딥시크가 엣지 컴퓨팅 기술, AIOps, IT 운영에 영향을 미칠 것으로 예상해야 한다고 덧붙였습니다. 딥시크는 기본적으로 답변을 설명할 수 있는 기능을 갖추고 있어 AIOps 솔루션에서 AI 기반 의사결정에 대한 신뢰와 이해를 구축하는 데 중요한 투명성을 제공합니다. LLM이 엣지 디바이스에서 실행되면 AIOps와 옵저버빌리티는 새로운 차원의 실시간 통찰력과 자동화를 달성할 수 있습니다. DeepSeek R1과 같이 엣지에서 실행할 수 있는 더 작은 설치 공간의 LLM을 AIOps와 통합하면 디바이스와 인프라를 보다 능동적이고 예측적으로 유지보수하거나 사람의 개입 없이 위험 완화 조치를 취할 수 있습니다.

IDG logo

▶   해당 콘텐츠는 저작권법에 의하여 보호받는 저작물로 기고자에게 저작권이 있습니다.
▶   해당 콘텐츠는 사전 동의 없이 2차 가공 및 영리적인 이용을 금하고 있습니다.


이 글이 좋으셨다면 구독&좋아요

여러분의 “구독”과 “좋아요”는
저자에게 큰 힘이 됩니다.

subscribe

구독하기

subscribe

Thor Olavsrud
Thor Olavsrud

CIO의 Senior Writer

공유하기