안녕하세요. 에디터 가을여행입니다.
요요즘 AI 세계는 정말 드라마 같죠? 오늘은 중국의 거대 IT 기업 Baidu(바이두)가 새로운 무기를 꺼내든 소식을 전해드릴게요. 바로 멀티모달 모델(LMM)인 'Ernie 4.5 Turbo'와 'X1 Turbo'의 출시 이야기예요. Baidu의 창립자 리옌훙(Robin Li) 씨가 DeepSeek(딥시크)를 콕 집어 비판하면서, "텍스트 모델 시대는 끝났다!"라고 선언한 거라니, 이 경쟁이 얼마나 재미있을지 상상이 가네요. 😄
Baidu가 이 모델을 발표한 건, 중국 우한에서 열린 개발자 컨퍼런스에서였어요. 텍스트는 기본, 오디오, 이미지, 비디오까지 처리하는 다재다능한 모델을 내놓은 거죠. DeepSeek는 아직 LMM을 출시하지 않았다는데, Baidu가 먼저 선점한 셈이에요.
Baidu의 새 모델 소개: 텍스트 넘어서 멀티모달의 세계로
Baidu의 새 모델, 'Ernie 4.5 Turbo'와 'X1 Turbo'는 정말 혁신적이에요. 이 모델들은 텍스트 처리뿐만 아니라 오디오, 이미지, 비디오를 동시에 다룰 수 있어요. 예를 들어, 제가 이 모델에 "이 사진 속에 뭐가 보이니?"라고 물으면, 이미지 분석을 하면서 설명을 해줄 거예요. 아니면, "이 비디오의 주요 장면을 요약해줘"라고 하면, 자동으로 핵심을 뽑아낼 테고요. Baidu는 25일 우한 컨퍼런스에서 이 모델을 공개하며, "이게 미래의 표준!"이라고 자신 있게 말했어요.
여기서 재미있는 점은 Baidu가 DeepSeek를 직접 겨냥했다는 거예요. DeepSeek는 아직 LMM을 출시하지 않았기 때문에, Baidu가 한 발 앞서간 셈이에요. 리옌훙 창립자는 "멀티모달 기능이 앞으로 AI 모델의 기본이 될 거야. 텍스트 기반 모델 시장은 점점 줄어들고, LMM 시장은 폭발적으로 성장할 테니까"라고 했어요.
실제로, Baidu에 따르면 이 모델의 API 가격은 DeepSeek의 DeepSeek-V3보다 약 40% 저렴하고, DeepSeek-R1의 가격은 4배나 비싸다고 해요. 게다가 성능은 텍스트 처리에서 DeepSeek를 능가할 뿐만 아니라, 오픈AI의 GPT-4o나 GPT-4.1과 비교해도 뒤지지 않아요. 아니, 일부 영역에서는 더 나을지도 모른다고 하니, Baidu의 자신감이 이해가 됩니다!
모델명 | 가격 | 성능 |
Baidu Ernie 4.5 Turbo | DeepSeek-V3 대비 40% 저렴 | DeepSeek 능가, GPT-4o 수준 |
DeepSeek-V3 | 높음 | 중간 |
DeepSeek-R1 | 매우 높음 | 중간 |
다음 이미지는 Baidu의 Ernie 4.5 Turbo와 경쟁 모델(GPT-4.1, GPT-4o 등)의 성능을 비교한 벤치마크 그래프입니다.
이 그래프는 Baidu Ernie 4.5 Turbo 모델이 텍스트 및 멀티모달 작업에서 GPT-4.1 및 GPT-4o와 유사한 수준의 성능을 보이면서도 더 빠르고 저렴하다는 것을 보여줍니다.
이 벤치마크는 Baidu의 Ernie X1 Turbo 추론 모델이 DeepSeek-R1 및 DeepSeek-V3와 같은 경쟁 모델과 비교했을 때 더 우수한 성능을 제공하면서도 가격은 DeepSeek R1의 1/4 수준으로 훨씬 저렴하다는 것을 보여줍니다.
Robin Li의 발언 분석: DeepSeek의 한계를 콕 집어 비판
이제 리옌훙 창립자의 발언을 더 깊이 파봐요. 그는 "DeepSeek 모델은 환각(잘못된 정보를 생성하는 현상)에 더 취약하고, 속도도 느리며 가격도 비싸"라고 지적했어요. 정말 직설적이지 않나요? 마치 AI 경쟁에서 "너희 제품, 좀 고쳐봐!"라고 말하는 것 같아요. 리 씨는 "새로운 모델 경쟁 환경이 끊임없이 변화하고 있어. 더 강력하고 저렴한 모델이 계속 등장할 거야"라고 덧붙였어요. 이 말은 DeepSeek의 혁신이 이미 과거의 이야기처럼 느껴진다는 뉘앙스예요.
DeepSeek-V3는 4개월 전, R1은 3개월 전에 출시됐어요. 그 이후로 오픈AI, 구글, 중국의 Alibaba(Alibaba AI)나 Tencent(Tencent AI) 같은 회사들이 더 나은 모델을 잇달아 내놓았죠. 심지어 DeepSeek도 5월 초에 R1과 V4를 출시할 계획이라고 알려졌지만, Baidu가 먼저 치고 나간 거예요. 리대표는 개발자들이 이 새 모델로 적은 비용으로 더 흥미로운 AI 애플리케이션을 만들 수 있게 도울 거라고 했어요. 이를 위해 Ant Group's Model Context Protocol (MCP)를 도입한다고 하니, 이는 AI 개발자들에게 꽤 유용할 거예요. 제 생각에, 이건 Baidu가 "개발자 여러분, 우리 모델로 재미있는 앱 만들어 보세요!"라고 손짓하는 것 같아요. 위트 있게 말하자면, AI 세계에서 Baidu가 "파티 주최자" 역할을 자청한 셈이죠!
이 타임라인은 2025년 초반까지의 주요 AI 언어 모델의 출시 시기를 보여주며, OpenAI, Baidu, DeepSeek 등의 모델이 포함되어 있습니다. 이 그래픽은 AI 언어 모델의 발전 속도와 주요 이정표를 시각적으로 표현합니다.
가격과 성능 비교: Baidu가 더 합리적인 선택?
Baidu의 모델이 왜 주목받는지, 구체적으로 비교해 볼까요? 먼저, 가격 측면에서 Ernie 4.5 Turbo의 API 가격은 DeepSeek-V3보다 40% 저렴해요. X1 Turbo는 DeepSeek-R1 가격의 4분의 1에 불과하다고 하니, 개발자 입장에서는 정말 매력적일 거예요. 예를 들어, 스타트업이 AI 챗봇을 만들 때, 비용을 절감하면서도 고성능 모델을 사용할 수 있으니까요. 성능 면에서는, 텍스트 처리에서 DeepSeek를 능가하고, 멀티모달 기능에서는 GPT-4o와 맞먹는다고 해요.
Baidu는 이 모델을 훈련하기 위해 자체 개발한 3세대 P800 Kunlun 칩 3만 개로 구성된 클러스터를 사용했다고 밝혔어요. 이는 중국에서 엔비디아가 아닌 자체 칩으로 모델을 훈련한 사례로, 최근 트렌드예요. 예를 들어, iFlyTek이 Huawei의 Ascend 910 칩으로 모델을 공개한 적이 있죠. 이처럼 중국 AI 업체들이 자력갱생하는 모습이 인상적이에요.
모델 | 가격 | 속도 | 멀티모달 능력 |
Ernie 4.5 Turbo | DeepSeek-V3보다 40% 저렴 | DeepSeek 능가 | GPT-4o와 맞먹음 |
X1 Turbo | DeepSeek-R1의 1/4 가격 | DeepSeek 능가 | GPT-4o와 맞먹음 |
DeepSeek-V3 | 비쌈 | 느림 | 텍스트 처리 |
DeepSeek-R1 | 매우 비쌈 | 느림 | 텍스트 처리 |
중국 AI 시장 동향: Baidu의 반격 선언
중국 AI 시장은 정말 치열해요. Baidu는 2018년에 가장 먼저 ChatGPT 대항마로 Ernie Bot을 출시했지만, 최근 Alibaba나 Tencent에 밀려 2등으로 전락한 상태였어요. 그런데 이번에 LMM 모델을 내놓으며 반격을 선언한 거죠. 지난 3월에 그동안 폐쇄형으로 유지하던 모델을 오픈소스로 전환한 것도 이 전략의 일부예요.
마지막으로, 이 소식을 마무리하며 제 생각을 공유할게요. AI 기술은 빠르게 진화하고 있어요. Baidu의 LMM 출시는 DeepSeek뿐만 아니라 전체 시장에 자극을 줄 거예요. 여러분도 Baidu의 새 모델을 한번 써보는 건 어떠세요? 저렴하고 강력하니, 재미있는 결과물이 나올 수 있을 테니까요. 😊
'인공지능' 카테고리의 다른 글
구글 NotebookLM 미친 업데이트! 한국어 방송 지원 (0) | 2025.04.30 |
---|---|
샌드 AI의 MAGI1: '물리적 움직임' 구현하는 동영상 모델 출시 (0) | 2025.04.28 |
ChatGPT-4o를 이용한 80가지 아트 스타일 (2/2) 41~80 (0) | 2025.04.27 |
ChatGPT-4o를 이용한 80가지 아트 스타일 (1/2) 1~40 (0) | 2025.04.27 |
무료 ChatGPT Deep Research 경량 버전 출시! 누구나 쉽게 경험하세요! (0) | 2025.04.26 |
댓글