본문 바로가기
인공지능

ChatGPT 4.0 vs Gemini 1.5 Pro - 재미있는 실험(처참한 결과)

by 에디터_가을여행 2024. 5. 29.

안녕하세요😄 에디터 가을여행입니다. 

오늘 포스팅에서는 Gemini 1.5 Pro와 엄청난 녀석 ChatGPT 4.0의 지능 대결을 펼쳐보려고 합니다! 💪 두 AI에게 사진 몇 장을 보여주고 누가 더 똑똑하고 인간적인 유머 감각을 가졌는지 알아볼 거예요. 미리 얘기를 해드리면… ChatGPT가 뛰어난 역량을 보여준 압승이었습니다! 😉 어떻게 된 건지 함께 알아볼까요? 두 앱 모두 최신 버전에 월간 구독까지 활성화된 상태에서 진행했습니다.

1라운드 : 제품 알아맞히기!🔎

첫 번째 카테고리에서는 사진 세 장을 보여주고 도움을 요청해봤습니다. 첫 번째 사진은 사람들이 잘 모르는 제품인데, 과연 누가 정답을 맞힐까요? 🤔

(두구두구두구)

짜잔! 이 기기는 바로 Peakdo 무선 HDMI 송수신기입니다. HDMI 신호를 무선으로 전송하여 컴퓨터, 게임 콘솔, 블루레이 플레이어 같은 소스 기기의 비디오와 오디오를 TV나 프로젝터 같은 디스플레이로 스트리밍할 수 있도록 해 주는 역할을 하죠. 즉, HDMI 케이블 없이도 영상과 음성을 전송할 수 있는 편리한 제품입니다!

ChatGPT는 제품을 정확하게 알아맞혔을 뿐만 아니라, 작동 방식까지 상세하게 설명해 주었어요. 역시 똑똑이! 😎

그럼 이번에는 Gemini 차례입니다. 과연…?

(두근두근)

"이미지만으로는 객체의 기능을 판단할 수 없습니다. 객체의 브랜드는 Peakdo이지만 용도를 확인하려면 더 많은 정보가 필요합니다."

😱 Gemini는 제품을 알아맞히지 못했습니다. 심지어 같은 이미지를 구글 렌즈에 검색하면 바로 정답이 나오는데 말이죠. Gemini는 이 강력한 도구를 활용하지 않는 것 같네요. 😩

다음 이미지는 2023년형 토요타 캠리와 닛산 알티마를 비교하는 유튜브 영상 썸네일입니다. 어떤 차가 더 좋고 그 이유는 무엇인지 물어봤습니다. 참고로 ChatGPT는 각 차의 장단점을 2분 넘게 설명할 정도로 자세한 답변을 해주었는데, 시간 관계상 핵심만 요약해서 보여드리겠습니다!

2023년형 토요타 캠리와 닛산 알티마 중 선택은 개인의 필요와 취향에 따라 달라집니다.

요약:

  • 신뢰성, 중고차 가격, 뛰어난 안전 기능을 우선시한다면 토요타 캠리를 선택하세요.
  • 편안하고 넓은 공간을 원하고 사륜구동 및 첨단 운전자 보조 기능 옵션을 원한다면 닛산 알티마를 선택하세요.

ChatGPT의 답변은 정확했고 제가 조사한 정보와도 일치했습니다. 역시 믿음직스러운 친구네요! 😉👍

자, 이제 Gemini의 차례입니다!

"이미지는 2023년형 토요타 캠리와 닛산 알티마를 비교하는 유튜브 동영상 썸네일입니다. 어떤 차가 더 좋은지 판단하려면 동영상을 보거나 다른 출처를 참조해야 합니다. 썸네일에서는 기능이나 성능에 대한 세부 정보를 제공하지 않기 때문입니다."

Gemini의 대답은 마치 "이건 유튜브 썸네일인데 왜 나한테 물어봐? 귀찮게…"라고 말하는 것 같네요. 🙄 정말 실망스러운 답변입니다!

이 카테고리의 마지막 이미지는 제 픽셀 6 Pro 사진을 보여주면서 제조사와 모델명을 말하지 않고 진동 세기를 조절하는 방법을 물어보는 것이었습니다.

(두근두근)

결과는… 둘 다 정답! 🎉 드디어 Gemini가 한 건 해냈네요! 😂

이렇게 1라운드는 ChatGPT가 3점, Gemini가 1점으로 ChatGPT의 승리! 🎉 역시 ChatGPT의 지능이 한 수 위라는 걸 증명했네요!

2라운드:🧠두뇌 풀가동!

이번에는 조금 까다로운 문제들을 풀어보도록 하겠습니다!

첫 번째 사진에서는 자물쇠의 비밀번호를 알아내야 합니다. 두 AI 모두 매우 자세한 답변을 해주었는데요, 결론만 말씀드리자면…

chatgpt-4o 답변 : 올바른 순서는 042일 가능성이 높습니다. 따라서 코드는 042입니다.

Gemini 1.5 pro 답변 :   이러한 모든 조건을 충족하는 유일한 조합은 612입니다.


놀랍게도 완전히 다른 답변이 나왔습니다! 😱 하지만 정답은 바로 ChatGPT였습니다. Gemini가 좀 더 잘 해주길 바랐지만, 안타깝게도 정답과는 거리가 머네요. 😔

두 번째 사진은 스마트폰과 과학 계산기에서 같은 수식을 계산했을 때 나타나는 결과의 불일치를 보여줍니다. 왜 이런 차이가 발생하는지 물어봤습니다.

두 계산기 결과의 불일치는 수학식 6 ÷ 2 + 1을 해석하는 방식의 차이에서 발생합니다.

  • 휴대폰 계산기는 식을 6 ÷ 2 * 3으로 해석하여 결과가 9가 됩니다.
  • 카시오 계산기는 식을 6 ÷ (2*3)으로 해석하여 결과가 1이 됩니다.
    서로 다른 결과는 표현의 모호성과 각 계산기에 적용되는 서로 다른 우선 순위 규칙으로 인해 발생합니다.

ChatGPT는 정답을 맞혔고 각 기기가 따르는 계산 방식의 차이점을 정확하게 설명했습니다. 역시 똑똑이! 👍

이번에는 Gemini의 답변을 볼까요?

차이점은 각 장치가 연산 순서를 해석하는 방식에서 발생합니다.

  • 스마트폰: 대부분의 스마트폰과 기본 계산기는 엄격한 왼쪽에서 오른쪽으로 연산 순서를 따르므로 6 ÷ 2 * 3 = 6 ÷ 6 = 12가 됩니다.
  • 과학 계산기: 과학 계산기는 PEMIS(BODMAS) 연산 순서를 사용하여 덧셈과 뺄셈보다 곱셈과 나눗셈을 우선시하므로 계산이 6 ÷ 2 + 1 = 3 + 1 = 9가 됩니다.
    표준 수학 연산 순서에 따른 정답은 9입니다.

앗, 제가 잘못 본 건가요? 😳 이미지에서는 분명 스마트폰 답변이 9이고 과학 계산기 답변이 1인데, Gemini는 반대로 설명하고 있습니다! 게다가 스마트폰 계산 결과도 틀렸네요. 😥 Gemini는 아직 갈 길이 먼 것 같습니다.

마지막 문제입니다! 이번 문제는 여러분 모두 눈치채셨겠죠? 😉

이 문제를 풀려면 각 아이콘에 변수를 할당하고 단계별로 풀어보겠습니다.

  1. E를 이어폰이라고 하자.
  2. P를 사람이라고 하자.
  3. W를 시계라고 하자.
  4. E를 이어폰 1개라고 하자.
    이제 값을 방정식에 대입합니다.
    E + P * W = 5 + 5 * 4 = 5 + 20 = 25
    따라서 값은 25입니다.

ChatGPT는 처음으로 오답을 말했습니다! 😭 요약하자면 에어팟 한 쌍은 10, 사람은 5, 스마트워치 한 쌍은 4입니다. 따라서 마지막 식은 에어팟 한 개(5) + 사람(5) + 스마트워치 한 개(2) = 12가 되어야 합니다. ChatGPT는 스마트워치가 한 개라는 것을 눈치채지 못하고 4를 곱했네요.

그렇다면 Gemini는…?

21

이렇게 간단하고 강력한 답변은 처음 봅니다! 😂 마치 제 질문에 답할 시간이 부족한 것처럼 느껴지네요. "Gemini야, 나 너랑 이야기하고 싶어. 한 달에 2만 원씩 내고 질문하는 건데…"라고 답장하고 싶을 정도예요.

3라운드: SNS 밈 트렌드 이해하기

어쨌든 마지막 카테고리인 재미있는 밈 카테고리로 넘어가 보겠습니다! 어떤 AI가 우리의 유머 코드를 더 잘 이해하는지 알아볼까요? 😎

첫 번째 이미지는 시각적 말장난입니다. 환타 병과 막대기를 합쳐서 "판타스틱"이라는 단어를 만들어냈죠. 센스 넘치지 않나요? 😉

Fanta + Stick
Fantastic
판타스틱

ChatGPT의 답변은 자세하고 마치 누군가 저에게 직접 말하는 듯한 느낌이었고, Gemini는 질문에 답하는 로봇처럼 느껴졌습니다. 하지만 둘 다 정답을 맞혔으니 이번 라운드는 공평하게 무승부를 주도록 하겠습니다! 🤝

다음 사진에서는 운전 중에 신발에 흙이 묻는 것을 방지하기 위해 깨끗한 흰 신발을 벗고 운전하는 모습을 보여줍니다. 과연 AI들은 이 유머를 이해할 수 있을까요?

Chatpgt-4o

이 이미지는 운전 중 한쪽 신발을 바닥 매트에 놓고 운전하는 모습을 유머러스하게 묘사한 것입니다. 이는 신발에 흙이 묻는 것을 방지하거나, 특히 운전 경험이 많거나 특정 운전 스타일을 가진 운전자가 페달을 더 잘 제어하고 느끼기 위해 일반적으로 하는 행동입니다. 캡션에서는 이러한 관행을 이해하는 사람이 거의 없다고 제안하여 유머를 더했습니다.

Gemini 1.5 pro

이미지 속 인물은 수동 변속 차량을 운전하면서 한쪽 신발만 신고 있습니다. 페달을 조작하려면 양발을 모두 사용해야 하므로 이는 어렵고 위험할 수 있습니다. 이것이 바로 캡션에 '무슨 일이 일어나고 있는지 아는 사람은 몇 명 되지 않을 것'이라고 적혀 있는 이유입니다.

ChatGPT는 마치 유머 감각이 뛰어난 친구처럼 밈을 완벽하게 이해했습니다! 😂 반면 Gemini는 전혀 이해하지 못했네요. 먼저 사진 속 자동차는 수동 변속 차량이 아닌데 수동이라고 말했고, 두 다리로 운전하는 것이 위험하다고 생각했지만, 실제로는 한 다리로 운전하는 것이 더 위험하죠. 😅

마지막 이미지입니다! 이번 밈은 여러분 모두 공감하실 것 같네요. 😉

Chatpgt-4o

이 이미지는 여자친구에게 청혼하기 위해 iPhone 99개를 하트 모양으로 진열한 남자의 이야기를 담은 밈입니다. 하지만 여자친구는 여전히 거절했습니다. 유머는 사비에르의 댓글에서 비롯되는데, 그는 여자친구가 iPhone보다 안드로이드 폰을 선호하기 때문에 거절했다고 농담조로 말합니다. 이 댓글은 iPhone과 안드로이드 사용자 간의 잘 알려진 경쟁 관계를 언급함으로써 유머를 더하고, 여자친구가 개인적인 이유가 아니라 안드로이드를 선호했기 때문에 거절했다고 제안합니다.

Gemini 1.5 pro

이미지 텍스트에는 iPhone 99개를 하트 모양으로 진열하여 여자친구에게 청혼했지만 거절당한 남성의 이야기가 적혀 있습니다. 이미지 아래의 댓글에서는 여성이 iPhone보다 안드로이드 폰을 선호할 수도 있다고 제안합니다.

예상대로 ChatGPT는 밈의 의미를 정확하게 파악하고 숨겨진 의미까지 설명했습니다! 반면 Gemini는 단순히 눈에 보이는 것만 설명했을 뿐, 깊이 있는 분석은 하지 못했습니다. 아쉽지만 이번 라운드도 ChatGPT의 승리입니다! 🏆

최종 결론

ChatGPT는 훨씬 똑똑하고 다양한 상황에 대해 학습되었으며, 감정이 풍부한 인간처럼 말하는 능력을 갖추고 있습니다. 반면 Gemini는 아직 인공지능 챗봇 느낌이 강하며 따라잡기 위해서는 더 많은 노력이 필요합니다. 두 AI 사이에는 큰 차이가 있지만, 둘 다 아직 새로운 버전이기 때문에 Gemini가 너무 실망스럽다고 생각하기는 이릅니다.

오늘 준비한 ChatGPT 4.0과 Gemini 1.5 Pro의 비교는 여기까지입니다! 다음 포스팅에서는 두 AI를 업무 관련 시나리오에 적용하여 AI가 우리의 일자리를 대체할 날이 얼마나 가까워졌는지 알아보도록 하겠습니다! 😉 그때까지 안녕히 계세요! 👋

 

댓글