• 실시간 속보창 보기
  • 검색 전체 종목 검색

뉴스속보

알파고 능가 "알파고 제로" 등장... 기보 없이 바둑 이치 터득
뉴스핌 | 2017-10-19 07:55:00

[뉴스핌=한기진 기자] 바둑 인간 최고수들을 격파한 바둑 프로그램 '알파고'를 능가하는 최신의 '알파고 제로'고 등장했다.

구글 딥마인드의 창업자인 데미스 허사비스 최고경영자(CEO) 등 이 회사 소속 연구원 17명은 19일(한국시간) '인간 지식 없이 바둑을 마스터하기'(Mastering the game of Go without human knowledge)라는 논문을 과학 학술지 '네이처'에 발표했다.

알파고 제로를 개발한 구글 딥마인드의 데이비드 실버 <사진=네이처>

외신에 따르면 알파고 제로는 바둑판만 놓고 '셀프 바둑'을 두면서 스스로 바둑의 이치를 터득한다. 바둑 규칙 외에는 아무런 사전 지식도 없고, 인간 고수들과 대전을 펼칠 필요없다. 승률을 높이는 좋은 수가 어떤 것인지 데이터를 스스로 쌓으면서 알파고 제로가 바둑을 이해하는 수준이 점점 높아진다.

이 학습 방식은 생물의 뇌에서 실제로 작동하는 '강화 학습'과 유사하다. 개에게 먹이를 주면서 '앉아' 등 특정 행동을 훈련 시키는 것과 비슷하다.

알파고 제로의 성능은 이세돌 구단을 4대 1로 이긴 버전('알파고 리'로 지칭)과 비교해 독학 36시간 만에 이 버전의 실력을 넘어섰다. 또 알파고 제로가 72시간 독학을 한 후 '이세돌 구단 대 알파고 리' 실전 당시와 똑같은 제한시간 2시간씩이라는 대국 조건에서 알파고 리와 대결한 결과, 100전 100승 무패를 기록했다. 알파고 제로가 한 수에 0.4초가 걸리는 '초속기' 바둑으로 490만판을 혼자 두면서 연구한 결과다.

알파고 제로는 앞으로 2900만판을 40일에 걸쳐 혼자 둔 후에는 올해 5월 현 세계랭킹 1위 커제 구단을 3대 0으로 꺾었던 기존 최강 버전 '알파고 마스터'의 실력마저 압도하게 됐다. 알파고 제로는 알파고 마스터에 100전 89승 11패를 올렸다.

알파고 제로는 독학하는 과정에서 인간이 알고 있는 정석을 스스로 깨달았을 뿐만 아니라, 독특한 정석을 개발하기도 했다.

교신저자인 데미스 허사비스와 공동 제1저자 3명 중 한 명인 데이비드 실버는 독학으로 바둑을 배운 알파고 제로가 기존 버전들보다 오히려 강한 이유에 대해 "인간 지식의 한계에 더 이상 속박되지 않기 때문"이라고 설명했다.

 

 

[뉴스핌 Newspim] 한기진 기자 (hkj77@hanmail.net)

이시각 주요뉴스
  • 한줄 의견이 없습니다.

한마디 쓰기현재 0 / 최대 1000byte (한글 500자, 영문 1000자)

등록

※ 광고, 음란성 게시물등 운영원칙에 위배되는 의견은 예고없이 삭제될 수 있습니다.