안녕하세요. 에디터 가을여행입니다.
정말 놀랍습니다! 오늘 소개해 드릴 영상은 구글 딥마인드(Google DeepMind)에서 "Veo 2"라고 명명한 새로운 생성형 AI 모델의 결과물입니다. 오늘 공개된 이 영상들은 현존하는 최고의 AI 영상 모델이라고 감히 말씀드릴 수 있습니다. 최근 리뷰했던 "소라(Sora) of Open AI"보다도 훨씬 뛰어난 결과를 보여주고 있습니다.
Veo 2
Veo is our state-of-the-art video generation model. It creates high quality video clips that match the style and content of a user's prompts, in resolutions up to 4K resolution.
deepmind.google
지금까지 공개된 수많은 AI 영상 중 단연 최고라고 할 수 있는 구글의 Veo 2 영상들, 지금부터 전문가의 시선으로 Veo 2가 왜 더 뛰어난지, 어떤 점에 주목해야 하는지 자세히 알려드리겠습니다. Veo 2가 왜 그렇게 특별한지 함께 살펴보시죠!
Veo 2, 디테일의 끝판왕
Veo 2의 가장 큰 강점은 바로 디테일한 표현입니다. 물론 소라 AI도 다른 AI 영상들에 비해 뛰어난 디테일을 보여줬지만, Veo 2는 소라를 뛰어넘는, 정말 놀라운 수준의 디테일을 선보였습니다.



영상을 보시면 강아지의 털, 튜브, 물결 등 모든 것을 정말 사실적으로 표현하고 있습니다. 심지어 강아지 꼬리가 좌우로 움직이는 모습, 균형을 잡기 위한 발의 미세한 움직임까지도 매우 정교하게 묘사하고 있습니다. 플라밍고가 먹이를 찾는 장면에서도 마찬가지입니다. 플라밍고의 다리 움직임, 부리가 물에 닿으면서 발생하는 물결까지, 다른 AI 영상에서는 종종 어색하게 표현되던 물의 움직임과 파장을 Veo 2는 완벽하게 재현하고 있습니다. 정말 놀라운 결과입니다.
특히 물속에 강아지가 다이빙하는 장면은 입이 다물어지지 않을 정도로 놀랍습니다. 물속으로 들어갈 때 발생하는 코스틱(caustic) 표현, 즉 물의 파장에 의한 빛의 굴절 부분까지 완벽하게 표현했습니다. 강아지가 다이빙하는 지점을 중심으로 물의 파장이 퍼져나가는 모습은 다른 AI에서는 상상도 할 수 없었던, 매우 사실적인 표현입니다. Veo 2는 물의 방향과 현재의 물리적 상황을 정확하게 이해하고, 프롬프트의 해석을 다른 AI와는 차원이 다르게 정확하게 따르고 있음을 알 수 있습니다.
Veo 2 vs. 다른 AI: 프롬프트 해석 능력 비교
Veo 2의 뛰어난 프롬프트 해석 능력을 보여주기 위해, 자동차 드리프트 영상 제작에 사용된 영어 프롬프트를 하나씩 해석하며 Veo 2가 얼마나 잘 표현하는지 살펴보겠습니다.

- 18mm 광각, 로우 앵글 트래킹 샷 포함 (18mm wide angle, including low-angle tracking shots): 광각 렌즈와 자동차의 드리프트 장면, 타이어 연기가 나는 부분, 카메라의 움직임까지 로우 앵글로 정확하게 표현하고 있습니다.
- 올리브 그린 머슬카가 다가오는 모습 (olive green muscle car approaching): 회전하는 바퀴에서 타이어 연기가 피어오르는 연출까지 정확하게 묘사하고 있습니다.
- 도시의 불빛과 조명이 앞으로 다가오면서 카메라의 반사 렌즈 플레어 효과 (city lights and lights come forward, the effect of the camera's reflective lens flare): 어두운 아스팔트, 노란색 택시가 배경에 있고, 네온 사인과 행인들이 도시의 에너지를 생생하게 전달하는 강렬한 장면을 완벽하게 표현하고 있습니다.
이처럼 Veo 2는 프롬프트의 99%를 완벽하게 구현해내고 있습니다. 현재 대부분의 AI 영상은 Full HD 이하의 사이즈로 제작 가능하며, 소라 AI는 1080p, 즉 Full HD 사이즈까지 가능하지만 많은 크레딧을 소모해야 합니다. 하지만 Veo 2 웹사이트에서는 4K 해상도까지 지원한다고 자랑스럽게 명시하고 있습니다. 아직까지 4K 화질을 생성할 수 있는 AI는 없었기 때문에, Veo 2는 정말 최고의 성능을 보여주고 있습니다.
Veo 2 vs. 다른 AI: 물리 법칙 이해도 비교
많은 AI 영상들이 공통적으로 겪는 한계는 바로 물리 법칙에 대한 이해 부족입니다. 실제 영상이라도 물리적인 표현이 맞지 않으면 어색함을 느끼게 됩니다. Veo 2와 다른 AI 영상들을 비교해 보면 이 차이를 명확하게 알 수 있습니다.

| AI 모델 | 고기 자르기 장면 | 생성 영상에 대한 평가 |
| Veo 2 | 고기를 자르면 당겨진 고기가 옆으로 정리되고 잘린 조각이 분리됩니다. | 물리 법칙을 정확하게 이해하고 사실적으로 표현합니다. |
| Sora | 고기가 다시 살아나는 듯한 어색한 움직임을 보입니다. | 물리 법칙이 어색하고 부자연스럽습니다. |
| RunwayML | 불로 태우는 듯 어색하게 표현됩니다. | 물리 법칙이 어색하고 부자연스럽습니다. |
| Kling | 고기가 다시 원래 상태로 돌아가는 등 어색한 움직임을 보입니다. | 고기를 자르는 행동을 이해하지 못하는 어색한 모습을 보입니다. |
| Luma Dream Machine | 고기를 먹는 듯한 어색한 움직임을 보입니다. | 고기를 자르는 행동을 이해하지 못하는 어색한 모습을 보입니다. |
| Hailuoai | 고기가 질겨서 문지르는 듯한 어색한 움직임을 보입니다. | 고기를 자르는 행동을 이해하지 못하는 어색한 모습을 보입니다. |
Veo 2는 고기를 자르면 당겨진 고기가 옆으로 정리되고 잘린 조각이 분리되는 것을 정확하게 표현하는 반면, 다른 AI들은 고기가 다시 살아나는 듯하거나, 불로 태우는 듯하거나, 문지르는 듯한 어색한 움직임을 보입니다. 이는 Veo 2가 다른 AI들에 비해 물리 법칙을 훨씬 잘 이해하고 있다는 것을 보여줍니다.
Veo 2 vs. 다른 AI: 벤치마크 결과 비교
구글은 Veo 2와 다른 AI 모델들의 성능을 비교한 벤치마크 결과를 공개했습니다. 이 벤치마크는 프롬프트 해석 능력과 결과물의 품질을 기준으로 평가했습니다.

- 초록색: Veo 2가 우세한 부분
- 흰색: 무승부
- 빨간색: 다른 AI가 우세한 부분
벤치마크 결과, Veo 2는 Meat, Kling, Minimax(hailuo), Sora AI와의 비교에서 50% 이상 우세한 결과를 보여줬습니다. 특히 프롬프트 해석 능력에서 Veo 2는 압도적인 성능을 보여주고 있습니다. 실제로 제가 사용해 본 결과, 클링 AI가 소라보다 더 나은 성능을 보여줬다고 생각했는데, 벤치마크 결과에서도 4개의 AI 중 클링이 가장 빨간색 부분이 적은 것을 확인할 수 있습니다. Veo 2는 클링보다 더 뛰어나다는 것을 벤치마크 결과를 통해 확인할 수 있습니다.
Veo 2 vs Sora: 실제 영상 비교
Veo 2에서 공개된 영상들의 프롬프트를 소라 AI에 입력하여 생성된 영상을 비교해 보겠습니다.

강아지 다이빙 영상의 경우, 소라 AI는 물의 파장에 의한 코스틱 표현을 제대로 표현하지 못했습니다. 강아지가 다이빙하는 지점을 중심으로 파장이 퍼져나가야 하는데, 소라는 이 부분을 정확하게 표현하지 못하고, 그냥 파도가 움직이는 정도의 표현만 보여주었습니다. 또한 물속과 바깥의 경계 표현도 애매하게 표현하는 등 Veo 2에 비해 훨씬 부족한 성능을 보여주었습니다.

플라밍고 영상 역시 Veo 2가 훨씬 더 사실적이고 아름다운 장면을 연출했습니다. 플라밍고의 다리 움직임, 부리를 중심으로 한 물의 파장 모두 Veo 2가 훨씬 더 잘 표현했습니다. 소라 AI는 여러 마리의 플라밍고가 움직이는 듯한 느낌을 주지만, 물의 파장은 전혀 사실적으로 표현하지 못했습니다.
AI 영상, 미래는?
AI 영상 리뷰를 게시하면서 많은 의견을 들었습니다. 대부분의 사람들은 놀라움과 함께 발전 가능성을 느끼고 있지만, 여전히 불편함을 느끼는 사용자나 시청자들도 많았습니다. 특히 일부 영화 제작자와 아티스트들은 AI가 창작을 대체할 가능성에 대해 여전히 회의적인 시각을 가지고 있습니다.
하지만 아바타, 터미네이터, 타이타닉 등 놀라운 영화들을 만들어낸 제임스 카메론 감독이 최근 Stability AI에 합류했다는 소식은 AI의 발전이 먼 미래의 일이 아니라는 것을 보여줍니다.
저는 이 빠르고 놀라운 변화의 세계 속에서 제가 직접 느끼고 경험한 결과들을 계속해서 공유하고, 실질적인 가능성에 대해 끊임없이 실험하고 여러분도 긴 여정을 함께 해주시길 바랍니다.
'인공지능' 카테고리의 다른 글
| Google AI Studio 완벽 가이드! 실시간 화면인식부터 코드 확인까지 (0) | 2024.12.22 |
|---|---|
| Genspark - 혼합 에이전트로 업무 효율을 극대화(20개월 무료 이벤트) (0) | 2024.12.20 |
| 앨런 - 이스트소프트의 포탈형 AI 검색 엔진 (0) | 2024.12.16 |
| 고퀄리티 롱폼 AI 영상 생성기 - 인비디오 AI (0) | 2024.12.15 |
| Gemini 2.0 출시: 에이전트 AI 시대의 서막 (0) | 2024.12.12 |
댓글