전체메뉴

검색
팝업창 닫기
이메일보내기

카메라가 행동 보며 최적 해답 내놔…언어이해력 90% 역대 최고

■구글 AI '제미나이' 공개…MS·오픈AI 연합에 반격

실제 사람 행동 실시간 해석·대응

과학적 지식에 영상·음악까지 학습

대부분 성능 측정서 GPT4 뛰어넘어

완전체 '울트라' 버전 내년 초 출시

한글 포함 100여개 언어로 서비스





구글이 선보인 제미나이(Gemini)는 초거대 인공지능(AI) 후발 주자라는 오명과 한 차례 출시 연기에 대한 아쉬움을 지울 만큼 뛰어난 성능을 보였다. 일각에서 ‘오픈AI의 GPT-4 터보에 긴장한 구글이 출시를 미뤘다’는 소문도 돌았으나 구글은 이를 압도하는 실시간 시야 인식 능력을 선보이며 기다림이 헛되지 않았음을 입증했다. 구글은 스마트폰 ‘픽셀’부터 검색·e메일·드라이브·독스 등 모든 서비스에 제미나이를 적용해 AI 선두 주자인 오픈AI와 마이크로소프트(MS)를 제치겠다는 각오다.

5일(현지 시간) 구글이 공개한 제미나이는 초거대 AI 성능 테스트인 MMLU(초거대 다중 업무 언어 이해)에서 최고 성능 모델인 울트라 기준 90%를 기록했다. 오픈AI의 GPT-4가 기록한 86.4%를 뛰어넘는 역대 최고 점수다. 오픈AI가 GPT-4 터보에 적용한 멀티모달(사진·영상·음성) 지표도 압도적으로, 대부분 성능 측정(벤치마크)에서 GPT-4를 뛰어넘는다. 제미나이는 GPT-4 터보에서 찾아볼 수 없던 실시간 시야 인식 능력도 갖췄다. 현재 공개된 GPT-4 터보의 멀티모달 기능은 이미지나 영상 파일을 GPT-4에 넣어 인식시키는 방식이다. 반면 제미나이는 AI가 카메라로 실제 사람의 행동을 보며 이에 대응해 소통한다.

단순히 사물을 인식하는 수준이 아니다. 종이에 펜으로 오리를 그리면 제미나이가 ‘새’임을 알고, 오리 옆에 물결 표시를 그리면 ‘오리’임을 파악한다. 오리의 몸을 파란색으로 칠하면 “흔치 않은 종(種)이지만 파란 오리도 있다”며 파란색 종에 대해 소개하고 파란색 목욕 장난감 오리를 보여주면 “실제 오리가 아니라 장난감 오리를 그렸구나”라고 답한다. 이 장난감이 물에 뜰지 물어보면 당장은 답하지 못하지만 손으로 찌그러뜨리는 모습을 보여주면 “플라스틱이고 속이 비어 있어 물에 뜨겠다”는 답을 내놓는다.

수학과 물리학에 대한 인식은 한층 정교화됐다. 네모난 모양의 차량과 앞면이 삼각형인 차량을 그린 뒤 어느 쪽이 더 빠를지 질문하자 “공기역학이 적용된 세모난 차가 더 빠르다”는 답을 내놓았다. 그래프가 그려진 수학 문제와 오답을 낸 풀이 과정을 보여주면 어떤 부분에서 틀렸는지 지적하고 올바른 수식도 내놓는다.

유튜브 영상과 음악 또한 학습했다. ‘매트릭스’ 주인공이 총알을 피하는 장면을 사람이 따라하자 “영화 ‘매트릭스’의 유명한 장면”이라고 답했다. 기타를 그리면 기타로만 연주한 음악을, 드럼과 베이스를 그리면 밴드 음악을 연주한다. 사물 인식과 판단력이 사람과 다를 바가 없다.



구글은 제미나이를 매개변수(파라미터) 규모에 따라 세 가지 모델로 분류했다. 이날 구글이 시연한 제미나이는 완전체인 ‘울트라’ 버전으로 내년 초 출시한다. 영어 외 타 언어 지원 미흡으로 출시가 연기됐다는 소문이 있었으나 엘리 콜린스 구글 딥마인드 프로덕트 부사장은 “100개 이상의 언어를 지원하고, 울트라 출시 연기는 안전성을 보다 확실히 하기 위함”이라며 일축했다.

개발자와 기업용인 프로는 올해 5월 선보인 구글 AI 도우미 바드에 즉각 적용돼 각종 구글 서비스에서 활용 가능하다. 다음 달부터는 검색과 광고, 크롬 브라우저까지 영역을 넓힌다. 구글은 “제미나이 적용으로 내부 테스트상 검색 소요 시간이 40% 줄었다”고 밝혔다. 개인용인 나노는 6일부터 일반 사용이 가능하다. 구글 TPU(Tensor Processing Unit)를 탑재한 스마트폰 픽셀8 프로에서는 인터넷·통신 연결 없이도 제미나이를 쓸 수 있다.

이는 제미나이가 TPU로 학습된 덕이다. 이날 구글은 제미나이 학습에 사용한 TPUv5도 공개했다. 전작보다 부동소수점연산(FLOPS) 속도가 2배 빠르고 제미나이 등 차세대 AI에서는 4배 빠른 연산 처리를 자랑한다. 엔비디아 그래픽처리장치(GPU)와 이를 사용한 오픈AI에 하드웨어 부분에서도 공세를 펼치는 셈이다.

제미나이 출시로 초대형 AI 경쟁은 더욱 격화할 것으로 전망된다. 전장은 단순 성능 비교가 아닌 최종 사용자가 접하는 서비스 분야로 넓어질 것으로 보인다. 오픈AI와 손잡은 MS는 이미 윈도 운영체제(OS)와 엣지 브라우저에 AI 코파일럿을 적용해 선공에 나섰다. 구글은 플랫폼과 하드웨어·스마트폰에까지 제미나이를 도입해 AI의 ‘수직계열화’를 이뤄 우위를 점하겠다는 전략이다. 한발 뒤처진 메타는 전날 IBM·인텔·AMD 등 50여 개 기업과 손잡고 ‘AI 동맹’을 구축하며 반격을 시도하고 있다. 제미나이는 한글을 포함한 100개 이상의 언어를 지원한다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >
주소 : 서울특별시 종로구 율곡로 6 트윈트리타워 B동 14~16층 대표전화 : 02) 724-8600
상호 : 서울경제신문사업자번호 : 208-81-10310대표자 : 손동영등록번호 : 서울 가 00224등록일자 : 1988.05.13
인터넷신문 등록번호 : 서울 아04065 등록일자 : 2016.04.26발행일자 : 2016.04.01발행 ·편집인 : 손동영청소년보호책임자 : 신한수
서울경제의 모든 콘텐트는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
Copyright ⓒ Sedaily, All right reserved

서울경제를 팔로우하세요!

서울경제신문

텔레그램 뉴스채널

서울경제 1q60