상세 컨텐츠

본문 제목

"AI 모델 활용 방식 급격한 변화 맞았다."

AI

by spacenews 2025. 2. 10. 15:43

본문

반응형

최근 AI 업계에서 가장 큰 주목을 받는 이슈는 ‘딥시크-R1’이다. 맷 마샬 벤처비트 설립자는 최근 칼럼을 통해 AI 모델 활용 방식이 급격하게 변화하고 있다고 분석했다.

과거에는 기업이 대형 AI 모델을 그대로 사용하는 방식이 일반적이었다면, 이제는 도메인 특화 모델이 대세라는 것이다. 또 이러한 변화의 중심에는 검색 증강 생성(RAG), 지도 미세 조정(SFT), 강화 학습(RL), 증류 등의 기술이 있다. 기업들은 이를 통해 AI의 효율성과 성능을 극대화하고, 비용 절감을 실현하려는 움직임을 보인다. 

 


딥시크-R1의 핵심 가치는 ‘고성능 AI를 더 저렴하게 제공할 수 있다’는 점이다. 기존 대형 모델인 ‘o1’과 비교했을 때 추론 비용이 30배 이상 저렴하며, 폐쇄형 모델과 달리 완전한 투명성을 제공한다. 이는 기업들이 비용 부담 없이 맞춤형 AI 모델을 구축할 수 있는 환경을 의미한다. 특히, 증류(Distillation) 기술이 AI 모델의 경량화와 맞춤화를 가능하게 하면서, 소형 모델의 역할이 점점 커지고 있다. 대형 모델을 기반으로 특정 도메인에 최적화된 경량 모델을 만들 수 있으며, 이는 기업 AI 전략에서 필수적인 요소가 되고 있다.

‘딥시크-R1’을 교사 모델로 활용하여, 특정 산업에 맞는 AI 모델을 제작할 수 있고, ‘라마’나 ‘큐원’과 같은 오픈 소스 모델을 활용한 증류 버전도 출시되고 있다. AI 개발자인 샘 위테빈은 “이제 기업들은 하나의 모델만 사용하는 것이 아니라, 다수의 모델을 혼합하여 최적의 성능을 내는 방향으로 전환하고 있다”라고 설명했다.

증류 모델이 성능과 비용 측면에서 강점을 보인다면, 전문적인 데이터가 필요한 경우에는 SFT(지도 미세 조정)와 RL(강화 학습)이 중요한 역할을 한다. 특정 산업 분야의 데이터가 부족한 경우, 기업이 자체 데이터를 학습하여 고유한 AI 모델을 만들 수 있다.  그러나 RL과 SFT는 일반적인 기업 환경에서는 다소 구현이 어려울 수 있다. 또한, 특정 도메인 데이터를 학습하는 과정에서 예측하지 못한 성능 저하나 데이터 편향 문제가 발생할 가능성도 존재한다. 따라서 대부분의 기업에서는 SFT나 RL을 적용하기보다 RAG(검색 증강 생성)를 활용하는 것이 더 효과적인 방법이 될 것으로 보인다. 

RAG의 핵심 장점은 기업이 자체 데이터베이스를 활용하여 모델을 보완 가능하다는 점이다. 이렇게 하면 대형 모델의 환각(hallucination) 문제를 줄이고 정확도를 높일 수 다. 예를 들어 AI 벤처기업 벡터라(Vectara)의 연구에 따르면, 현재 딥시크-R1의 환각률은 14%, 오픈AI ‘o3’ 모델은 8%로 나타났다. 이는 여전히 AI 모델이 신뢰성을 완벽하게 확보하지 못했음을 의미한다. RAG를 활용해 기업 데이터와 결합하는 것이 중요한 해결책이 되는 이유이다. 이런 맥락에서 오픈AI의 딥 리서치(Deep Research)는 RAG 기반 AI의 대표적인 성공 사례로, 웹을 검색하고 정보를 분석하여 연구 결과를 제공하는 기능을 갖추고 있다. 이는 AI가 단순한 질문 응답 시스템을 넘어, 실제 연구를 수행하는 단계로 진화하고 있음을 보여준다.

AI 모델의 추론 비용은 시간이 지날수록 더욱 낮아질 전망이다. 딥시크-R1의 추론 비용은 기존 모델(o1, o3)과 대비할 때 30배 저렴하다. 이 얘기는 거꾸로 하면 오픈AI, 앤트로픽, 구글 등의 AI 기업들은 마진을 90% 이상 줄여야 경쟁력을 유지할 수 있다는 뜻이 된다. 앤트로픽 CEO 다리오 아모데이는 “AI 모델 개발 비용은 매년 4배씩 낮아지고 있으며, 결국 추론 비용은 0에 가까워질 것”이라고 전망했다. 이는 AI 개발이 대기업 중심에서 소규모 기업과 개인 개발자로 확산될 가능성을 시사한다. 앞으로는 대기업이 독점하던 AI 모델이 아닌, 다양한 산업과 개인 개발자가 주도하는 AI 혁신 시대가 열릴 것이라는 의미다.

AI 모델이 발전하면서 점점 더 중요한 요소가 되는 것은 ‘데이터의 품질’이다. 아메리칸 익스프레스 CTO 힐러리 패커는 “AI의 성공적인 활용은 결국 데이터 검증과 정확성에 달려 있다”고 강조했다. 기업들은 자체 데이터 관리 역량을 키우는 것이 경쟁력을 결정하는 핵심 요소가 될 것이다. 또한 대형 AI 모델이 아니라, 도메인 특화된 소형 AI 모델을 활용하는 방향으로 변화할 것으로 예상된다. RAG, SFT, RL 등의 기술을 활용하여 맞춤형 AI를 구축하는 사례 증가할 것이다. 또한 AI 추론 비용의 급격한 감소로 인해, 소규모 기업과 개인 개발자도 AI 활용이 가능해질 것이다. 

결국, AI 시장의 경쟁력은 기술 그 자체보다, 데이터를 얼마나 효율적으로 활용할 수 있는가에 달려 있다. 기업들이 AI 모델을 도입하는 방식이 근본적으로 바뀌고 있으며, 앞으로 AI를 활용하는 기업과 활용하지 않는 기업 간 격차가 더욱 커질 것으로 보인다. 

은이은 | unyiun@outlook.kr 

 

 

Midjourney Prompt : A futuristic data center with glowing blue AI servers in operation. At the center, a translucent AI core representing 'DeepSeek-1' emits a soft light, surrounded by smaller AI models interconnected through a dynamic digital network. Floating digital codes and graphs visually depict the flow of information. In the background, AI researchers analyze data while remote servers power distilled AI models. The illustration highlights the concept of model distillation and efficiency. A sleek, cyberpunk-inspired aesthetic with a cool blue color scheme emphasizes the advanced technology and innovation.

반응형

관련글 더보기