뉴스 > 언론사별 뉴스

언론사별 뉴스

테스트 나선 구글 "바드(Bard)", MS 빙보다 떨어지는 성능에 혹평 빗발쳐... "충격적으로 실망스럽다"
에이빙 | 2023-03-24 09:53:58

지난달 8일(현지 시각) 프랑스 파리에서 구글이 행사를 진행하며 자사의 AI 기반 검색엔진을 설명하는 모습 | 출처 - 구글 공식 유튜브

구글과 마이크로소프트(MS)의 인공지능(AI) 챗봇 경쟁이 치열하게 전개되는 가운데, 구글의 '바드(Bard)'가 MS의 '빙(bing)'보다 성능이 떨어진다는 평가가 이어지고 있다.

23일(현지 시각) 미국 경제매체 비즈니스 인사이더에 따르면, 구글이 지난 21일부터 미국과 영국 일부 이용자들을 대상으로 바드에 대한 테스트에 돌입했다. 이는 구글이 바드 출시를?예고한 지 약 한 달 반 만에 이뤄지는 테스트로, 앞서 MS가 빙의 테스트를 시작한 것보다도 한 달 이상 늦은 시기다.

특히 테스트 기간이긴 하지만, 이용자들은 바드에 대한 실망감을 나타내고 있다고 비즈니스 인사이더 측은 보도했다. 시장에선 비록 바드의 출시는 늦었어도 구글이 전 세계 검색 시장을 장악하고 있는 만큼 챗GPT를 등에 업은 MS를 넘어설 것이라는 기대가 있었다.

그러나 테크 유튜버 마르키스 브라운리는 자신의 트위터를 통해 "오늘 구글 바드를 좀 이용해 봤는데, 이런 말을 하게 될 줄은 상상도 못 했다"라며, "(특정 채팅 기능에서) 빙이 구글의 바드를 훨씬 앞선다."라고 평가했다.

펜실베이니아대학교 와튼스쿨의 에단 몰릭 부교수 역시 "바드는 빙이나 GPT-4만큼 학습 도구로써?능력이 있어 보이지 않는다"라며, "시를 짓는 데 바드는 경쟁자인 빙보다 많이 뒤처져 있다. 프랑스의 39행으로 된 시 시스티나를 짓는 데 바드는 고전하는 것 같다."라고 혹평했다.

나아가 단어 퍼즐 게임에서 바드의 능력이 떨어진다는 평가도 나왔다. 게임 제작자들에 따르면, 한 쌍의 단어가 무엇을 의미하는지를 맞히는 온라인 퍼즐 '투퍼 구퍼(Twofer Goofer)'에서 바드는 하나의 정답도 맞히지 못한 것으로 알려졌다. 해당 게임에서 오픈AI가 최근 출시한 GPT-4는 96%, 인간이 82%의 정답률을 나타낸 것과는 큰 격차를 보였다.

투퍼 구퍼의 제작자인 콜린 월독은 이러한 결과에 대해 "충격적으로 실망스럽다"라며, "바드는 프롬프트가 주어졌을 때 단 하나도 풀지 못했다."라고?실망감을 내비쳤다.

앞서 바드는 지난달 8일 공개 시연 당시 제임스 웹 우주망원경에 대해 태양계 밖 행성을 처음 촬영한 망원경이라는 답변을 내놓아 '오답 논란'에 휩싸인 바 있다. 미국 항공주구국(NASA)에 따르면, 태양계 밖 행성을 처음 촬영한 것은 유럽남방천문대의 초거대 망원경(VLT)이었기 때문.

이러한 전례 때문인지 구글 측은 바드 시험판을 공개함과 동시에 기대치를 낮추라고 강조하는 등, 이전과 달리 보수적인 모습을 보이기도 했다. 아울러 앞으로 더 많은 국가와 언어로 바드를 이용할 수 있도록 테스트 대상을 확장하겠다면서도, 바드의 공식 출시 시기를 구체적으로 밝히진 않았다.

한편, 구글은 "우리는 지금까지 바드를 테스트하면서 많은 것을 배웠고, 이를 개선하기 위한 다음 단계는 더 많은 사람으로부터 피드백을 받는 것"이라고 강조했다. 나아가 이번 테스트가 대규모로 진행되는 만큼 순조롭게만 이뤄지지는 않을 것이라며, 이번 테스트를 거쳐 바드의 문제점들이 조목조목 드러날 것이라고 설명했다.

이시각 주요뉴스