슈퍼컴도 아닌 AI가 포커도 꺾었다

유용하 기자

입력 2017-03-03 22:42

업데이트 2017-03-04 00:25

글씨 크기 조절
글자크기 설정

닫기

글자크기 설정 시 다른 기사의 본문도 동일하게 적용 됩니다.
- 가
- 가
- 가
- 가
- 가
프린트
공유하기
공유

닫기
- 페이스북
- 네이버블로그
- 엑스
- 카카오톡
- 밴드
https://www.seoul.co.kr/news/society/science-news/2017/03/04/20170304008026
URL 복사
댓글
14

스스로 학습 ‘딥스택’… 5초 내 베팅

프로도박사 11명 상대 3000회 게임… 10명에게 압도적 승리·1명에게 우세
“속임수 가능해 승리 어려워” 뒤엎어… “치료법 추천 등 정보 비대칭 때 유용”

인공지능(AI)이 퀴즈대회, 체스, 장기, 바둑에 이어 포커게임에서도 인간을 눌렀다. 이번엔 슈퍼컴퓨터가 아닌 게임용 PC를 이용했는데도 인간 고수를 꺾었다.

이미지 확대

캐나다와 체코 공동연구진이 개발한 인공지능 프로그램이 10의 160제곱에 이르는 경우의 수를 가지고 있는 포커게임에서 프로 도박사들을 상대로 승리를 거뒀다. 사이언스 제공 — 캐나다와 체코 공동연구진이 개발한 인공지능 프로그램이 10의 160제곱에 이르는 경우의 수를 가지고 있는 포커게임에서 프로 도박사들을 상대로 승리를 거뒀다.
사이언스 제공

캐나다 앨버타대, 체코 카렐대, 체코공과대 공동연구진은 포커게임을 할 수 있는 AI프로그램 ‘딥스택’을 개발했다. 딥스택에 1000만건의 게임상황을 만들어 입력시키고 스스로 학습하도록 한 뒤 프로 도박사들과 게임을 했다. 이 결과가 세계적인 과학저널 ‘사이언스’ 3월 3일자 논문으로 실렸다.

포커는 불완전한 정보를 바탕으로 복잡한 결정을 내려야 하는 작업이다. 포커게임에서 나올 수 있는 경우의 수는 최대 10의 160제곱에 이르는 것으로 알려져 있다. 바둑에서 나올 수 있는 경우의 수인 10의 170제곱보다는 적다. 하지만 여기에 ‘정보 비대칭성’이 개입한다. 체스나 장기, 바둑은 상대방의 게임 정보가 완전히 공개된 정보 대칭 상태이지만 포커는 공개된 패 이외에 볼 수 있는 카드는 플레이어 자신이 가진 카드뿐이다. 게다가 포커 참가자들 간에 속임수(블러핑)를 쓸 수 있다는 점에서 더 복잡하고 어렵다.

이 때문에 AI의 승리가 쉽지 않다는 평가가 있었고 실제로 2015년 미국 카네기멜론대가 개발한 포커게임 AI ‘클라우디코’는 인간에게 큰 차이로 패배했다. 지난 1월 카네기멜론대 연구진이 후속작으로 내놓은 ‘리브라투스’가 세계 정상급 프로도박사 4명과 대결해 승리하면서 가능성을 내비치기는 했다.

리브라투스는 슈퍼컴퓨터를 활용해 모든 경우의 수를 계산했지만, 딥스택은 게임용 PC를 이용해 게임을 거듭할 때마다 스스로 능력을 키워 최적화한 수를 계산하는 딥러닝 기술을 적용했다.

딥스택과 도박사는 ‘텍사스 홀뎀’이라는 포커 게임을 했다. 자신이 가진 칩 한도 내에서 무제한 걸 수 있는 방식이다. 딥스택은 베팅을 할지 포기를 할지 5초 내에 결정을 내리면서 게임을 해나갔다. 지난해 이세돌 9단과 바둑을 겨룬 구글의 AI 알파고에게 돌을 내려놓기까지 15초가 주어졌던 것과 비교하면 판단시간도 더 빠르다.

딥스택은 프로 도박사 11명을 상대로 3000차례의 게임을 치러 10명을 압도적으로 이겼다. 나머지 1명에 대해서도 절대적 우위를 차지하지는 않았지만 통계적으로 유의미한 수준에서 우세를 보였다고 연구진은 설명했다.

마이클 볼링 앨버타대 컴퓨터과학과 교수는 “딥스택 같은 AI 프로그램은 적의 전력을 알기 어려운 방위 분야에서 전략을 수립하거나 의사를 대상으로 치료법을 추천하는 등 정보 비대칭성이 있는 상황에서 유용하게 쓰일 것”이라고 말했다.

유용하 기자 edmondy@seoul.co.kr

2017-03-04 8면