Published on

챗GPT 폰이 온다, 근데 앱이 없다 — 오픈AI가 조니 아이브와 만드는 AI 기기

Authors
  • Name
    Twitter

"앱이 없다."

샘 알트먼이 오픈AI 직원들에게 설명한 새 스마트폰의 핵심 특징이 이거다. 아이콘이 격자로 가득한 화면도 없고, 뭔가를 열고 닫는 행위 자체가 없다. 그냥 말을 하면 AI가 알아서 처리한다.

4월 마지막 주, 오픈AI가 퀄컴·미디어텍과 함께 AI 전용 스마트폰 칩을 개발 중이라는 사실이 알려졌다. 퀄컴 주가가 단 하루 만에 13% 넘게 뛰었다. 시장은 이미 반응했다. 이건 루머가 아니다.

오픈AI가 개발 중인 AI 기기의 미래 컨셉 — 미니멀한 스마트 스피커 형태

조니 아이브가 다시 돌아왔다

2019년 애플을 떠난 조니 아이브. 아이맥, 아이팟, 아이폰을 설계한 그가 처음엔 서서히 잊혀가는 것처럼 보였다. 그런데 2025년 5월, 오픈AI가 그의 하드웨어 스타트업 'io Products'를 65억 달러(약 9조 원)에 인수했다.

오픈AI 역사상 최대 규모의 인수합병이었다. 그것도 전액 주식 교환 방식으로. 얼마나 확신이 있으면 현금도 아니고 주식을 저렇게 쏟아붓나 싶었다.

조니 아이브가 합류하면서 오픈AI 하드웨어팀은 200명 규모로 커졌다. 당 탄이라는 전직 애플 엔지니어가 최고 하드웨어 책임자를 맡고, 조니 아이브는 디자인 총괄이다. 알트먼은 직원들에게 "회사 역사상 가장 큰 프로젝트"라고 했다. 첫해 목표가 1억 대다. 아이폰이 첫 해에 판 게 140만 대였다는 걸 생각하면 꽤 공격적인 숫자다.

첫 기기는 스마트폰이 아니다

많이들 착각하는데, 오픈AI가 제일 먼저 내놓는 건 스마트폰이 아니다. 2027년 초에 나올 첫 번째 제품은 카메라가 달린 스마트 스피커다. 가격은 200~300달러선이 될 것으로 알려졌다.

화면이 없다. 스피커에 카메라를 달아서 주변 환경을 인식하고, 음성으로만 상호작용한다. 영어로 된 보도를 보면 애플 HomePod에 가까운 형태라는 표현이 많았다. 거기에 챗GPT의 두뇌가 들어간다고 보면 된다.

여기에 더해 스마트 안경, 스마트 램프도 개발 중이다. 이 모든 기기가 공통적으로 화면이 없거나 최소화된 형태다. 알트먼이 "이 기기는 스마트폰보다 훨씬 평화롭다(peaceful)"고 한 말이 이해가 된다. 아침에 폰을 집어 들고 유튜브 알고리즘에 30분 날리는 경험을 AI가 차단해주겠다는 것인데, 솔직히 이게 될까 싶기도 하다. 우리가 알림을 끄고도 폰을 달고 사는 이유가 있지 않나.

스마트폰은 2028년이 목표

오픈AI AI 스마트폰 — 앱 없이 ChatGPT가 인터페이스를 대체하는 미래 기기 컨셉

스마트 스피커와 별개로, 스마트폰 프로젝트도 동시에 굴러가고 있다.

오픈AI는 퀄컴, 미디어텍과 각각 AI 전용 칩 개발 협력에 들어갔다. 제조는 럭스쉐어가 독점 담당한다고 알려졌는데, 럭스쉐어는 애플 제품도 조립하는 중국 제조사다. 한국 공급망 분석가 밍치궈에 따르면 2027년 상반기 양산 시작, 실제 출시는 2028년이 목표다.

이 폰의 핵심 개념은 '앱 없는 스마트폰'이다. 인스타그램 아이콘을 탭하는 게 아니라 "내 친구한테 사진 공유해줘"라고 말하면 AI 에이전트가 알아서 처리한다. ChatGPT가 사실상 운영체제 역할을 하는 구조다.

냉정하게 말하자면 이건 기술보다 UX 문제다. 음성 인터페이스가 터치스크린만큼 직관적으로 느껴지려면 AI 정확도가 99% 수준에 도달해야 한다. 1%가 틀리는 게 1번에 한 번이면, 사람들은 금방 지쳐서 다시 아이폰 집어든다. 그게 과거 음성 비서들이 다 실패한 이유기도 하다.

그래서 목소리 AI부터 갈았다

5월 8일, 오픈AI가 실시간 음성 AI 모델 3종을 공개했다. 이게 AI 기기 전략이랑 직결된다.

GPT-리얼타임-2는 GPT-5급 추론 능력을 가진 실시간 대화 모델이다. 사람이 말을 중간에 끊거나 내용을 수정해도 즉시 반응한다. 음성 이해 정확도 96.6%. 기존 GPT-4o 음성 모드와는 레벨이 다르다.

GPT-리얼타임-트랜슬레이트는 70개 이상 언어를 13개 언어로 즉시 번역한다. 실시간으로. 통화하면서 동시통역이 된다는 소리다.

GPT-리얼타임-위스퍼는 초저지연 음성 전사 모델이다. 말하는 동시에 텍스트가 생성된다.

이 3종 모두 API로 개방됐다. 질로(Zillow) 같은 부동산 플랫폼은 이미 음성으로 매물 검색하고 방문 예약하는 기능을 개발 중이다. 도이체텔레콤은 고객 지원에 적용하고 있다. 개발자들한테 미리 깔아두는 셈이다. 기기가 나왔을 때 쓸 앱 생태계를 지금부터 만드는 거다.

애플·삼성한테는 어떤 의미인가

AI 기기 생태계 경쟁 — 오픈AI vs 애플 vs 삼성 구도 컨셉

이 흐름을 보면서 삼성이 더 긴장할 것 같다.

애플은 자체 AI(Apple Intelligence)가 있고, iOS 생태계 결속력이 워낙 세서 단기간에 흔들리지 않는다. 반면 삼성은 갤럭시 AI를 구글 제미나이 기반으로 돌리는 구조다. 오픈AI가 안드로이드 진영을 직접 파고들면 삼성 입장에선 한 쪽에선 애플, 다른 쪽에선 오픈AI가 압박하는 그림이 나온다.

물론 오픈AI도 위험이 있다. 하드웨어는 소프트웨어랑 다르다. 모델 업데이트는 클릭 한 번이지만, 폰 리콜은 다른 차원의 문제다. 조니 아이브가 천재인 건 맞지만, 아이폰이 성공한 건 디자인만이 아니라 앱스토어라는 생태계가 있었기 때문이다. 오픈AI가 그 생태계를 얼마나 빨리 구축하느냐가 관건이다.

10년 넘게 이 업계 봐오면서 느끼는 건, 새 디바이스 카테고리는 보통 사람들이 생각하는 것보다 2~3년 더 걸린다는 거다. 알트먼이 2028년이라고 했으면 실제 대중화는 2030년 전후가 되지 않을까 싶다. 그래도 방향성 자체는 맞다. 앱을 탭하는 것보다 말하는 게 더 자연스러운 시대가 언젠간 온다.

AI 기기 전쟁의 시작

정리하자면 이렇다. 오픈AI는 두 개의 하드웨어 트랙을 동시에 달리고 있다.

하나는 2027년 스마트 스피커. 카메라 있고, 화면 없고, 음성으로만 쓴다. 거실이나 책상 위에 두는 형태다. 다른 하나는 2028년 스마트폰. 앱이 없고 ChatGPT가 인터페이스를 대체한다. 퀄컴·미디어텍이 칩 만들고, 럭스쉐어가 제조한다.

그 두 기기를 연결하는 게 이번에 나온 실시간 음성 AI 모델이다. 기기의 두뇌이자 귀다.

성공할지는 모르겠다. 근데 적어도 지금 이 흐름은 진지하게 봐야 한다. 65억 달러 인수, 200명 팀, 퀄컴 주가 13% 급등. 이 정도면 허풍은 아니다.