Published on

메타 뮤즈 스파크, 라마 버리고 GPT에 정면 승부 걸었다

Authors
  • Name
    Twitter

메타가 8일(현지시간) 새 AI 모델 '뮤즈 스파크(Muse Spark)'를 공개했다. 이름보다 중요한 건 이게 라마 시리즈의 후계자가 아니라는 점이다. 오픈소스는 없다. 코드도 안 준다. 오픈AI처럼 유료 서비스로만 쓸 수 있다.

라마를 무기로 삼아 "우리는 개방의 편"이라고 외쳐온 게 메타였다. 그런데 그 메타가 하룻밤 사이에 전략을 뒤집었다.

라마4 실패가 만든 결단

작년 4월, 메타가 라마4를 내놓았을 때 반응은 차가웠다. 벤치마크 수치는 그럴싸했는데 막상 쓰면 다른 얘기였다. 라마4 후기를 찾아보면 "상위 모델 대비 체감 성능이 너무 처진다"는 말이 많았다. 개발자 커뮤니티에서도 냉담했다.

저커버그는 결단을 내렸다. 작년 6월, 스케일AI에 143억 달러(약 21조 원)를 투자하고 창업자 알렉산더 왕을 메타 최고AI책임자(CAIO)로 데려왔다. 그리고 '아보카도'라는 프로젝트명 하에 9개월간 팀을 꾸려 AI 스택을 처음부터 재구축했다.

그 결과물이 뮤즈 스파크다.

21조짜리 드림팀이 9개월 만에 내놓은 것

메타 초지능연구소 뮤즈 스파크 출시, 빛나는 신경망 AI 이미지

뮤즈 스파크가 라마와 다른 점은 크게 두 가지다.

첫째, 네이티브 멀티모달이다. 기존 모델들은 텍스트 모델에 나중에 이미지 인식을 얹는 방식이었다. 뮤즈 스파크는 처음부터 텍스트와 시각 정보를 통합해 설계됐다. 추론 과정 자체에 이미지가 녹아든다는 뜻이다. 그래프를 보면서 설명하거나 그림을 보고 수식을 풀거나 하는 작업에서 체감 차이가 생긴다.

둘째, 효율성이다. 메타 측은 "라마4 매버릭과 동등한 성능을 내는 데 필요한 컴퓨팅이 10배 이상 줄었다"고 밝혔다. 이게 사실이라면 운영 비용에서 의미 있는 차이가 생긴다. AI 서비스 수익성 문제가 업계 전체의 고민인 시점에 이 수치는 꽤 중요한 신호다.

메타는 뮤즈 스파크를 메타초지능연구소(MSL)의 첫 작품으로 소개했다. 공개 전까지 '아보카도'라는 이름으로 불리던 이 모델이 9개월 만에 세상에 나온 셈이다. "어느 때보다 빠른 속도로 스택을 재구축했다"는 메타의 말이 허투루 들리지 않는 이유가 여기 있다.

벤치마크로 뜯어보면

AI 모델 벤치마크 비교, 뮤즈 스파크 vs GPT vs 클로드 vs 제미나이

숫자부터 보면 이렇다.

아티피셜 애널리시스 종합 인텔리전스 인덱스에서 뮤즈 스파크는 52점으로 4위다. 1~3위는 GPT-5.4(57), 제미나이 3.1 프로(57), 클로드 오퍼스 4.6(53) 순이다. 1~3위와는 아직 격차가 있다.

강한 구간은 따로 있다. 그래프와 수식 이해력을 측정하는 CharXiv 리즈닝에서 86.4점으로 1위를 차지했다. 제미나이 3.1 프로(80.2)와 GPT-5.4(82.8)를 모두 앞질렀다. 의료 분야 벤치마크 헬스벤치 하드에서도 42.8%로 전 모델 중 최상위였다.

AI 업계에서 가장 까다로운 시험으로 불리는 HLE(Humanity's Last Exam)에서는 Contemplating 모드 기준 50.2%를 기록했다. GPT-5.4 프로의 43.9%보다 높다. 다만 아티피셜 애널리시스 공개 테스트에서는 39.9%로 집계됐다. 테스트 방식 차이가 있어 어느 숫자가 더 현실적인지는 좀 더 봐야 한다.

솔직히 1위를 기대했다면 실망스럽다. 4위다. GPQA 다이아몬드(PhD 수준 추론)에서는 89.5%로 클로드(92.7%), GPT-5.4(92.8%), 제미나이(94.3%)에 모두 뒤처졌다. 그래도 9개월 전 "라마4 실패"에서 출발했다는 걸 감안하면 꽤 빠른 회복이다. 라마4가 나왔을 때와 달리 이번엔 개발자 커뮤니티 반응이 확연히 다르다.

35억 명 SNS와 합체되면

메타 AI SNS 통합, 페이스북 인스타그램 와츠앱 AI 오버레이 이미지

벤치마크 얘기만 하면 반쪽짜리다. 메타의 진짜 무기는 다른 곳에 있다.

메타는 페이스북, 인스타그램, 스레드, 와츠앱을 합치면 월간 사용자 35억 명이 넘는다. 오픈AI, 구글, 앤트로픽이 AI를 팔기 위해 사용자를 끌어모아야 하는 반면, 메타는 이미 35억 명을 깔고 있다.

뮤즈 스파크는 일단 meta.ai 사이트와 앱을 통해 먼저 서비스된다. 이후 페이스북, 인스타그램, 와츠앱, AI 안경(레이밴 메타)에도 순차적으로 통합된다는 계획이다.

개인적으로 여기서 흥미로운 시나리오가 보인다. 와츠앱에서 직접 AI와 대화하는 게 일상이 되면, 별도로 ChatGPT를 열 이유가 줄어든다. 오픈AI가 10년에 걸쳐 쌓으려는 걸 메타는 기존 앱 업데이트 한 번으로 배포할 수 있다. 이게 메타의 진짜 경쟁력이다.

시장도 이 논리에 동의했다. 발표 당일 메타 주가는 6.5% 급등했다. 월가에서는 "35억 명 SNS 제국과의 시너지가 상당한 수익화 잠재력"이라는 평가가 나왔다.

오픈소스를 버린 게 맞는 선택인가

이 질문이 사실 가장 중요하다.

라마는 단순한 제품이 아니었다. 메타가 AI 생태계에서 구축해온 이미지 자체였다. 개발자들이 라마를 쓰면서 메타 인프라와 엮이고, 그게 다시 메타 생태계를 강화하는 구조였다. 그 자산을 이번 결정으로 걷어차는 셈이다.

메타는 앞으로도 일부 모델은 오픈소스로 공개하겠다고 했지만, 최고 성능 모델은 폐쇄형으로 간다는 방향은 분명해 보인다.

이게 틀렸다고 생각하지 않는다. 라마4 실패 이후 메타가 선택할 수 있는 길이 많지 않았다. 오픈소스 전략만 고집하면 최고 성능 모델을 만들 인센티브가 줄어들고, 투자 회수도 안 된다. 지금 AI 시장은 "기술을 공유하는 시대"에서 "기술로 돈을 버는 시대"로 빠르게 이동 중이다.

다만 10년간 쌓아온 오픈소스 신뢰를 잃는 비용은 숫자로 안 잡힌다. 개발자 커뮤니티의 신뢰가 증발하는 속도는 생각보다 빠를 수 있다. 구글이 오픈소스 프로젝트들을 하나씩 접어가면서 겪은 것처럼.

뮤즈 스파크가 실제 서비스에서 어떤 체감을 줄지, 그리고 라마의 빈자리를 무엇으로 채울지. 이 두 가지가 앞으로 메타 AI의 향방을 결정할 것 같다.