IT··7 min read

오픈소스 AI vs 클로즈드 AI, 승자는

Llama 3 vs GPT-5, 오픈과 클로즈드 진영의 격차가 좁혀지고 있다

아니 이렇게 빨리 따라잡을 줄은

2023년만 해도 오픈소스 AI는 GPT-4 앞에서 그냥 아마추어였다. 격차가 너무 커서 비교 자체가 민망할 정도였다.

근데 2025년 말 기준으로 Meta의 Llama 3.1 405B가 여러 벤치마크에서 GPT-4를 넘겼다. 세상이 진짜 빠르게 바뀌고 있다.

핵심은 단순히 성능이 따라잡았다가 아니다. 게임의 규칙 자체가 바뀌고 있다. 예전에는 "어떤 모델이 더 똑똑한가"가 전부였는데, 지금은 "내 상황에 맞게 쓸 수 있는가"가 더 중요한 질문이 됐다.

근데 숫자를 보면 좀 놀랍다

HuggingFace Open LLM Leaderboard 기준으로, 2025년 12월 상위 10개 모델 중 6개가 오픈소스 계열이다. 2년 전에는 1개였다.

a16z 기업 AI 리포트에 따르면 조사 대상 기업의 46%가 오픈소스 모델을 주력으로 쓰고 있었다. 2023년에 15%였으니 3배 성장이다.

특히 금융, 의료, 법률 같은 규제 산업에서 오픈소스 선호도가 높다. 이유가 뭐냐면 데이터를 외부 API로 보내고 싶지 않아서다. 환자 정보나 금융 거래 데이터를 OpenAI 서버로 보내면 규제 위반 리스크가 크니까. 자체 서버에서 돌리면 이게 깔끔하게 해결된다.

GDPR이 적용되는 유럽이나, 개인정보 보호법이 강화된 한국에서도 마찬가지다. 데이터 주권 이슈가 오픈소스 AI의 가장 강력한 세일즈 포인트가 되고 있다.

오픈소스가 확실히 세게 먹히는 데가 있다

직접 써보면서 느낀 건데, 오픈소스가 압도적으로 유리한 케이스가 있다.

첫째는 파인튜닝이 필요한 도메인 특화 작업이다. 한국어 법률 문서 분석할 때 GPT-5에 프롬프트 엔지니어링을 아무리 해봐야, 전문 파인튜닝된 Llama 모델한테 못 이겼다. 특정 도메인 데이터로 직접 훈련할 수 있다는 건 결정적인 장점이다. 클로즈드에서는 원천적으로 불가능하다.

둘째는 비용이다. 하루 API 호출이 10만 건 넘어가면 클로즈드 API 비용이 감당이 안 된다. 한 스타트업 CTO한테 들은 건데 GPT-4 API에서 Llama 3.1 자체 호스팅으로 바꾸면서 월 AI 비용이 1,200만 원에서 300만 원으로 줄었다고 한다. 75% 절감. (이 정도면 안 바꾸는 게 이상하다.)

셋째는 레이턴시. 자체 서버에 띄우면 네트워크 왕복 시간이 없으니까. 챗봇이나 자동 완성에서 200ms랑 800ms 차이는 체감이 엄청 크다.

넷째는 커스터마이징 자유도다. 모델 아키텍처 수정, 특정 레이어만 학습, 추론 파이프라인 최적화. 클로즈드 모델에서는 불가능한 수준의 제어권을 가질 수 있다.

다들 오픈소스 오픈소스 하는데

라고들 하는데, 클로즈드 모델이 여전히 넘사벽인 영역도 있다.

멀티모달이 대표적이다. 이미지, 음성, 영상을 통합적으로 처리하는 능력에서 GPT-5랑 Claude 4는 오픈소스를 크게 앞선다. 복잡한 차트 분석하거나 화면 캡처 보고 코드 짜는 작업에서 격차가 극명하다. 오픈소스 멀티모달 모델도 나오고 있긴 한데, 아직 갈 길이 멀다.

추론 능력도 아직 차이가 있다. 수학 올림피아드 문제나 복잡한 논리 추론에서 클로즈드 모델이 한 10~15% 높은 정확도를 보인다.

그리고 무엇보다 편의성. API 하나 호출하면 끝나는 거랑, GPU 서버 세팅하고 모델 배포하고 모니터링하는 건 완전히 다른 이야기다. 5명짜리 스타트업이 직접 GPU 서버 관리하는 건 좀 무리가 있다. 모델 업데이트, 서버 장애 대응, 비용 최적화까지 다 신경 써야 하니까.

결국 누가 이기나

승자는 둘 다다. 정확히 말하면 "둘 다 쓰는 조직"이 이긴다.

프로토타입은 클로즈드 API로 빠르게, 검증된 기능은 오픈소스로 자체 호스팅. 이 하이브리드 전략이 2026년 주류가 되고 있다.

양자택일 프레임 자체가 틀렸다는 게 내가 2년간 지켜보면서 내린 결론이다. 리눅스랑 윈도우가 서버랑 데스크톱에서 각자 영역 갖고 있는 거랑 비슷하다.

어느 한쪽이 완전히 이기는 시나리오보다 용도에 따라 공존하는 시나리오가 훨씬 현실적인데, 이 판이 앞으로 어떻게 더 흔들릴지는 솔직히 예측하기 어렵다. 양쪽 다 다룰 수 있는 역량을 키우는 게 개발자로서는 가장 안전한 베팅인 것 같긴 한데.

관련 글