알파고 제로 무엇이 다른가

이세돌 9단을 꺾은 알파고 리는 프로 바둑기사 대국기록 16만건을 보고 학습했다. 제4국에서 이세돌 9단이 알파고를 이겼던 건 이 대국 기록에 ‘인간의 실수’가 있었기 때문일지 모른다. 그런데 최신 버전의 알파고는 이런 오류가 발생하지 않는다. 사전 지식이 없이도 스스로 학습이 가능해서다. AI가 점점 무서워지고 있다. 더스쿠프(The SCOOP)가 더 무서워진 알파고 제로의 세계를 살펴봤다.

▲ 알파고 제로는 인간의 데이터 없이 바둑을 학습해 40일 만에 모든 알파고 버전을 뛰어넘었다.[일러스트=아이클릭아트]

‘바둑의 신神’ ‘인공지능(AI)의 새로운 지평’ ‘4차 산업혁명을 앞당겼다’…. 구글 딥마인드의 AI 알파고의 최신 버전 ‘알파고 제로’를 두고 쏟아지는 찬사다. 그 흔한 립서비스가 아니다. 알파고 제로의 바둑 실력은 어지간한 프로 바둑기사를 뛰어넘는다. 바둑 평가 기준 중 하나인 엘로(Elo) 점수로 보자. 보통의 프로 바둑기사가 2900점대인 반면 알파고 제로는 5000점이 넘는다. 지난해 이세돌 9단을 꺾었던 ‘알파고 리’를 100번 만나 100번 꺾었으니, 탁월한 실력을 가늠할 만하다. 

더 놀라운 건 알파고 제로의 성능만이 아니다. AI 핵심요소인 학습방식은 ‘충격’을 전하기 충분하다. 사례로 풀어보자. 알파고 제로 이전 버전의 학습 방식은 ‘지도’다. 쉽게 말해, 인간이 정해준 ‘답’을 보고 배운다. 그래서 방대한 빅데이터는 필수다. 실제로 이세돌 기사와 자웅을 겨뤘던 알파고 리는 대국 기록 16만건을 보고 바둑을 익혔고, 가상 대국을 통해 실력을 키웠다. 인간의 학습방식으로 치면 ‘연습문제’를 풀고 실전에 돌입한 셈이다.

알파고 제로의 학습 방법은 완전히 다르다. 무엇보다 데이터가 주어지지 않았다. 기본적인 규칙만 배운 뒤 곧바로 실전(가상 바둑)에 들어갔다. 새 알파고의 이름을 ‘제로(Zero)’라고 붙인 이유다. 알파고 제로의 첫 대국은 바둑의 최하급수인 18급 수준으로 끝났다. 기본 규칙밖에 몰랐던 탓이었다. 하지만 가상 대국을 이어나가면서 알파고 제로는 승률이 높은 수를 찾아나갔다. 그렇게 둔 대국만 2900만회에 달했다.

그러자 놀라운 일이 벌어졌다. 알파고 제로는 학습을 시작한 지 24시간 만에 알파고 리의 실력을 따라잡았다. 알파고 리가 이세돌과의 대결을 위해 7개월간 학습한 것에 비하면 월등히 빠른 속도였다. 72시간이 지나자 알파고 제로는 알파고 리를 100대 0으로 완파했다. 40일 후에는 모든 알파고 버전의 능력치를 넘어섰다.

알파고 제로의 승리가 갖는 의미는 꽤 크다. AI의 무한성장 가능성을 보여주기 때문이다. AI 업계의 화두인 무인차의 예를 들어보자. 무인차의 핵심 기술은 자동차 외부의 여러 정보를 빠른 시간 안에 정확히 분석, 최적의 결정을 내리는 AI다. 기존 AI의 학습방식으로는 각 국가별ㆍ도시별 도로의 상황이 빅데이터로 정리돼 있어야 한다. 그런데 알파고 제로의 학습방식으로는 이런 것들이 필요 없다. 기존 데이터가 없이도 그때그때 최적의 판단을 내릴 수 있다.

김진호 서울과학종합대학원(빅데이터MBA) 교수는 “각국에서는 자율주행 AI를 만들기 위해 무료로 전기차를 보급하면서까지 데이터 축적에 열을 올리고 있다”면서 “인간 데이터에 의존하지 않는 AI는 개발에 있어 시간과 비용을 절감할 수 있을 것”이라고 강조했다.

인간 지식에 얽매이지 않아

알파고 제로의 장점은 이뿐만이 아니다. 알파고 제로 이전 버전은 인간 프로 바둑기사의 수를 토대로 실력을 쌓았다. 프로도 경기에서 실수를 할 때가 있다. 그렇다면 그 경기를 보고 배운 AI도 그 실수를 반복할 가능성이 높다. 하지만 알파고 제로에는 이런 오류가 발생하지 않는다. 알파고 제로가 기존 버전마저 압도적으로 넘어선 이유 역시 인간의 실수가 담긴 데이터가 배제됐기 때문이다.

이식 한국과학기술정보연구원 실장은 “딥마인드가 알파고의 활동무대로 바둑을 선택했던 이유 중 하나는 바둑이 AI의 성능을 테스트하기에 좋은 분야였기 때문”이라면서 “알파고 제로의 성공은 데이터가 충분하지 않은 분야에서도 AI가 성과를 낼 수 있다는 가능성을 보여준 것”이라고 설명했다.

그렇다고 한계가 없다는 건 아니다. 알파고 개발 총책임자인 데이비드 실버 유니버시티칼리지런던 교수는 영국 BBC와의 인터뷰에서 이렇게 말했다. “게임처럼 명백한 룰이 있는 분야와 다르게 변수가 많고, 예측할 수 없는 현실 세계에 이런 기술을 활용하는 것은 또 다른 일이다.” 하지만 알파고 제로는 무섭게 성장하고 있다. 다양한 규칙과 범례를 주입하면 ‘놀라운 변신’을 거듭할지 모른다. 충격은 시작됐고, AI는 점점 무서워지고 있다.
임종찬 더스쿠프기자 bellkick@thescoop.co.kr

저작권자 © 더스쿠프 무단전재 및 재배포 금지

개의 댓글

0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400

내 댓글 모음