본문 바로가기
인공지능

GPT-4o 출시! 정말 대박입니다!

by 에디터_가을여행 2024. 5. 23.

안녕하세요. 에디터 가을여행입니다. 어제 새벽, 오픈AI에서 드디어 GPT-4o를 출시했습니다! 제가 방금 사용해 봤는데... 진짜 미쳤습니다. 웬만해서는 이런 얘기 안 하는데, 진짜 성능이 미쳐가지고 깜짝 놀랐어요!

그래서 오늘은 GPT-4.5 출시 기념으로, 어떤 기능들이 있는지, 왜 기존 모델들보다 훨씬 뛰어난지 제가 직접 경험한 후기를 공유해 드리려고 합니다! 🔥

GPT-4o 대체 뭐가 달라졌을까? 🤔

GPT-4o는 오픈AI의 "스프링 업데이트"라는 이름으로 발표되었는데요, 오픈AI 웹사이트에 가시면 스프링 업데이트 페이지에서 여러 가지 기능들을 확인해 볼 수 있습니다!

Spring Update Page Link

 

자, 그럼 바로 GPT-4.5가 어떤 기능들을 가지고 있는지 살펴볼까요? 😉

Text, Vision, Audio 삼박자 갖춘 "Omni Model"

GPT-4.5는 텍스트, 비전, 오디오, 이 세 가지를 모두 완벽하게 처리하는 'Omni Multimodal' 이라고 할 수 있습니다. 기존 GPT-4보다 비전, 오디오 쪽으로 훨씬 업그레이드되었고, 특히 텍스트는 훨씬 더 빠르게 답변합니다. 진짜 사람이랑 대화하는 속도랑 거의 비슷해요!

게다가 API도 출시되어서, 2배 더 빠르고 50%나 저렴한 가격으로 API를 사용할 수 있다는 사실! 개발자 여러분들, 희소식이죠? 

드라마틱한 감정 표현까지? 😳 인간과 구별 불가능한 오디오 대화!

GPT-4o를 사용하면서 가장 놀라웠던 건 바로 오디오 대화 기능입니다. 기존 GPT-4에서도 모바일 앱에서 오디오 대화 기능을 제공했지만, 솔직히 말해서 답변도 느리고, 제대로 알아듣지도 못해서 실망스러웠거든요.

하지만 GPT-4o는 완전히 달라졌습니다! 훨씬 빠르게 대답하는 건 물론이고, 진짜 사람처럼 자연스럽게 말하는 게 정말 신기했어요. 심지어 감정 표현까지 해준다니까요! 😂😭😄

기존에는 클로드 모델에 비해 로봇처럼 딱딱하게 대화한다는 평가가 많았는데, 이제는 GPT-4o 가 훨씬 더 인간적인 면모를 보여주는 것 같습니다. 마치 영화 속 인공지능 여자 친구, 남자 친구 같다고나 할까요? 😎

실시간 이미지 분석으로 상황 파악까지!

GPT-4.5는 실시간 이미지 분석 기능도 갖추고 있습니다. 카메라를 통해 실시간으로 상황을 분석하고, 사람들의 감정이나 상황에 맞는 대화를 이어나갈 수 있죠!

(케이크를 보고 생일 축하 노래를 불러주는 GPT-4o)

이제 토니 스타크의 자비스는 현실이 될 수 있는 걸까요? 상상만 해도 정말 짜릿하지 않나요?

윈도우 화면 인식? 수학 문제 풀이까지? 🤯

더 놀라운 건, GPT-4o는 제가 작업하고 있는 윈도우 화면까지 인식할 수 있다는 겁니다. 예를 들어, 제가 수학 문제를 풀다가 막혔을 때 GPT-4o에 도움을 요청하면, 화면에 보이는 수학 문제를 직접 분석해서 풀이 과정을 단계별로 설명해 줍니다.

(화면 속 수학 문제를 분석해서 풀이 과정을 설명해주는 GPT-4o)

이제 영어 회화 선생님, 수학 과외 선생님도 필요 없어지는 걸까요? 😅 앞으로 교육 분야에도 엄청난 변화가 찾아올 것 같습니다.

(GPT-4o 스프링 업데이트 영상)

이미지 생성, 3D 모델링까지? 만능 재주꾼! 🎨

스프링 업데이트 영상에서는 따로 소개하지 않았지만, GPT-4o는 이미지 생성, 3D 모델링 기능까지 갖추고 있습니다.

- 텍스트를 이미지로 변환: 로봇이 타자기를 치는 모습을 만들어달라고 하면 뚝딱! 하고 만들어 줍니다.

(GPT-4o 이미지 생성 예시)

- 캐릭터 디자인 및 유지: 이전에는 이미지 생성 후 캐릭터를 유지하면서 추가 편집을 하는 것이 어려웠는데, GPT-4.5는 이 문제를 완벽하게 해결했습니다!

(캐릭터를 유지하면서 다양한 이미지를 생성하는 GPT-4o)

- 텍스트를 3D 모델링으로 변환: 이제 3D 모델링도 GPT-4o에게 맡겨보세요! 오픈AI, 정말 무서운 회사입니다... 다른 회사들은 어쩌라고 이렇게 다 잘하는 걸까요?

3D 모델, 캐리커쳐, 필기체, 폰트제작, 로고제작 등

 

회의록 요약, 영상 강의 내용 요약도 가능!

GPT-4o는 회의록 요약, 영상 강의 내용 요약도 척척 해냅니다.

  • 회의록 요약: 여러 명이 말하는 회의 내용을 업로드하면, 각 참석자별 발언 내용을 정확하게 구분하고 요약해 줍니다.
  • 영상 강의 내용 요약: 45분짜리 영상 강의 내용도 텍스트로 추출하고 깔끔하게 요약해 줍니다.

 

데스크탑 앱 출시! 이제 PC에서도 편리하게! 🖥️

드디어 GPT-4o 데스크탑 앱이 출시되었습니다! 아래 링크에서 다운로드할 수 있습니다.

https://persistent.oaistatic.com/sidekick/public/ChatGPT_Desktop_public_latest.dmg

(데스크탑 앱 화면)

데스크탑 앱에서는 GPT-3.5, GPT-4, GPT-4o를 모두 사용할 수 있고, 새롭게 추가된 기능들도 이용할 수 있습니다.

- 음성 대화: 헤드셋 버튼을 누르면 바로 음성 대화 모드로 전환됩니다.

(데스크탑 앱 음성 대화 예시)

- 이미지 업로드 및 분석: 클립 이모티콘을 누르면 나타나는 '업로드 포토' 기능을 통해 이미지를 업로드하고 분석할 수 있습니다.

- 화면 캡처 및 분석: '테이크 스크린샷' 기능을 통해 화면을 캡처하고 GPT-4o에게 질문할 수 있습니다.

(GPT-4o 코드 삽입과 분석 결과)

 

마무리 : 직접 경험해 보고 느낀 점~ 소름 돋는 발전 속도!

솔직히 말해서, 영상으로만 봤을 때는 '뭐 얼마나 대단하겠어?'라는 생각을 했었는데... 직접 데스크탑 앱을 다운로드해서 사용해 보니 정말 소름이 끼쳤습니다.
AI 기술이 이렇게 빠르게 발전하고 있다는 사실에 놀라움을 금치 못했고, 앞으로 GPT-4o를 활용해서 만들어낼 수 있는 것들이 무궁무진하다는 생각에 가슴이 벅차오릅니다.

GPT-4o는 답변 속도도 빠르고 퀄리티도 훌륭해서, 앞으로 다른 AI 모델들은 쳐다도 안 볼 것 같습니다. 저는 개인적으로 GPT-4의 열렬한 팬이었는데, GPT-4o는 그 기대를 완벽하게 뛰어넘는 놀라운 모델입니다!

댓글