AI 트렌드
2017년 AI 주요 뉴스
2017/12/29 by 이수경

지난 2016년 스위스의 다보스에서 열린 제45차 세계경제포럼(WEF) 연차총회(이하 다보스 포럼)에서 ‘제4차 산업혁명’에 대한 논의가 시작된 이후, 인공지능(artificial intelligence, AI)은 글로벌 패러다임으로 급부상했다[1]. 불과 2년의 세월이 흐른 지금 AI에 관한 전 세계적인 관심이 폭발적으로 늘어나며 AI가 적용된 제품과 서비스를 우리 실생활에서도 손쉽게 찾아볼 수 있게 됐다. 이번 글에서는 올 한 해 일어난 주요 AI 뉴스를 정리했다. 한국 언론에 보도된 인공지능 관련 기사 중 빈도수가 높은 것을 선정 기준으로 삼았다. 분량상의 문제로 학회에 제출한 논문, 기업 인수 및 투자, 서비스 공개 관련 기사는 제외했다.


1월

크리스틴 스튜어트, AI 관련 논문 발표

영화 "트와일라잇(Twilight)"의 주인공으로 유명세를 탄 할리우드 배우 크리스틴 스튜어트(Kristen Stewart)가 머신 러닝 논문[2]의 공동 저자[3]로 나섰다.

[ 그림 1 ] 스타일 이미지(가운데)를 콘텐츠 이미지(왼쪽)에 적용한 결과(오른쪽)[4]

논문을 통해 소개된 기술인 "스타일 변형(Neural Style Transfer)’은 [그림 1]처럼 반 고흐나 마르크 샤갈과 같은 예술가의 화풍을 기계학습한 뒤, 보통의 이미지를 예술 작품으로 바꿔준다. 이 같은 방식은 프리즈마(Prisma)라는 사진 필터 앱을 통해 유명해진 바 있다. 크리스틴은 자신의 첫 감독 데뷔작인 단편 영화 "컴스윔(Come Swim)"에서 일부 장면을 인상주의 풍으로 연출하는데 이 기술을 활용했다.

크리스틴 스튜어트의 데뷔작, "컴스윔(Come Swim)"에서 인상주의 풍으로 연출된 장면을 확인해볼 수 있다.


2월

美 카네기멜론대 AI, 세계 최초로 인간 상대 포커 승리

인공지능 포커가 인간 포커 선수를 상대로 승리를 거머쥐었다. 미국 피츠버그 리버스 카지노에서 20일간 열린 ‘두뇌 vs.인공지능 : 판돈을 올려라(Brains vs. Artificial Intelligence: Upping the Ante)’라는 포커 대회에서 네 명의 인간 포커 선수들을 상대로 경기를 치른 끝에 약 170만 달러(18억 5,640만원) 상당의 칩을 확보한 것. 인공지능 프로그램이 포커에서 인간을 이긴 것은 이번이 처음이다.

[ 그림 2 ] 토마스 샌드홈 교수(가운데)와 포커 선수들

승리의 주인공은 바로 미국 카네기 멜런 대학(Carnegie MellonUniversity) 컴퓨터 과학과의 토마스 샌드홈(Tuomas Sandholm)교수와 박사 과정 중인 노암 브라운(Noam Brown)이 개발한 리브라투스(Libratus).

리브라투스는 헤드-업 무제한 텍사스 홀덤(Heads-Up, No-Limit Texas Hold’em)[5]을 플레이하는 AI 프로그램으로, PSC(Pittsburgh Supercomputing Center)에서 1,500만 학습시간을 기반으로 포커 규칙을 분석하고 자체 전략을 수립하는 알고리듬을 사용했다.

그동안 체스(1997년 IBM의 딥블루[6]), 퀴즈쇼(2006년 IBM의 왓슨), 바둑(2016년 구글 딥마인드의 알파고)에서 인공지능은 이미 인간을 넘어섰다. 하지만 포커는 예외로 점쳐졌다. 블러핑[7], 지연플레이 등 부정확한 정보를 바탕으로 의사 결정 해야하는 게임이기 때문이다. 리브라투스의 개량 전 버전인 클라우디코(Claudico)가 2015년 5월 열린 같은 대회에서 패한 이유도 여기에 있다.


3월

구글, 캐글(Kaggle) 인수

구글이 미국 샌프란시스코에서 열린 "클라우드 넥스트컨퍼런스(Cloud Next Conference)"에서 캐글 인수를 공식 발표했다. 구글은 캐글을 활용해 자사 클라우드 컴퓨팅 플랫폼 성능을 높인다는 계획이다.

호주 멜버른 기반 스타트업인 캐글은 전 세계 데이터 과학과머신 러닝 등 인공지능과 관련한 글로벌 경진대회를 개최하고 관련커뮤니티 그룹을 운영해왔다. 캐글은 문제를 보다 정확하게 해결할 ‘방법"을 찾는 기업과 실력을 가늠할 ‘기회’와 현실의 ‘문제’를 원하는 데이터 과학자를 서로 연결해 준다는 점에서 연구자들 사이에서 큰인기를 끌고 있다.

대표적으로 국제선 항공기의 도착 시간을 보다 정확히 예측할 방법을 찾던 미국 제너럴 일렉트릭(GE)은 거액의 상금과 함께 날씨, 비행기 위치, 비행 시간, 연료 소비량 등을 담은 빅데이터를 캐글에 제공했다.

[ 표 1] GE의 국제선 항공기 도착시간 예측 경진 대회(GE flight quest)

캐글을 통해 세계 곳곳의 데이터 과학자가 개인으로 또는 팀을 구성해 경쟁에 나섰다. 우승자가 개발한 알고리듬은 비행기 도착시간을 기존 방식 대비 49% 더 정확하게 예측할 수 있었던 것으로 알려졌다.


4월

알리바바, 스타크래프트 전략 학습하는 AI 공개

보통 스타크래프트와 같은 실시간 전략 시뮬레이션(Real-timestrategy, RTS) 게임에서 각 팀은 상대를 이기기 위한 최적의 전략을 선택한다. 팀은 다수의 에이전트(agent)로 구성되며, 에이전트는 이 전략을 달성하고자 같은 팀의 다른 에이전트와 협력한다. 그런데 이런 대규모 멀티 에이전트 시스템에서는 에이전트 수가 증가하면 매개 변수가 급격하게 커지는 과제에 직면하게 된다. 각각의 에이전트가 받아들일 정보와 수행할 행동을 효율적으로 처리할 수 없게 된다는 의미다. 스타크래프트가 인공지능으로 정복하기 가장 어려운 게임으로 알려진 이유다.

[ 그림 4 ] BiCNet을 구조화한 모습[8]

구글, 페이스북 등 글로벌 IT 공룡들이 스타크래프트에 도전장을 내민 가운데, 중국 알리바바(Alibaba)와 영국 유니버시티 칼리지 런던(University College London)도 공동 연구를 통해 관련논문[9]을 발표했다. 사람의 시연이나 감독학습(supervisedlearning) 없이도 숙련된 스타크래프트 게이머처럼 전략을 배워서 플레이한다는 것이 골자다. 이 연구팀은 해당 문제를 해결하기 위해 ‘멀티 에이전트 양방향 조정 네트워크(BiCNeT) [그림 4]’를 고안했다. 이를 통해 인공지능은 전투에 참여하는 유닛의 수와 위치, 유닛 조합에 따라 전략을 바꿔 가는 능력을 배운다.


5월

커제 9단, 알파고에 3戰 전패

세계 랭킹 1위인 커제 9단이 중국 저장(浙江)성 우전(烏鎭) 인터넷국제컨벤션센터에서 열린 알파고와의 대국에서 완패했다. 앞서 두 차례 연패한 커제 9단은 마지막 대국에서 자신에게 더 유리한 백돌을 요청했으나 불계패했다.

[ 그림 5 ] 커제 9단이 알파고와 대결을 펼치고 있다.

이날 커제와 대결을 펼친 알파고의 버전은 알파고 마스터(Alphago Master)다. 지난 2016년 이세돌 9단과 대결을 펼쳤던 것보다 업그레이드된 것으로, 상대방에게 최소 3점 이상 주고도 이길 수 있을 정도로 강해졌다. 알파고 마스터는 스웨(時越), 미위팅(芈昱廷), 탕웨이싱(唐韋星), 천야오예(陳耀燁), 저우루이양(周睿羊) 프로 9단등 중국 바둑 5명을 상대로도 불계승을 거뒀다.


6월

말루바 AI, 미즈팩맨 최고기록 갱신

1980년대 전 세계를 강타한 아케이드 비디오게임인 미즈팩맨(MsPack-man). 팩맨의 여자친구인 미즈팩맨의 행동이 예측하기 어렵고, 플레이 횟수도 제한돼 있어 난해한 게임으로 잘 알려져있다. 사람이 기록한 최고점수는 26만 6,330점. 그간 구글의 딥마인드를 포함해 여러 인공지능이 미즈팩맨에 도전했지만 만점을 기록하진 못했다.

[ 그림 6 ] 미즈팩맨 게임 화면

그런데 올해 초 마이크로소프트가 인수한, 캐나다 몬트리올 AI스타트업인 말루바(Maluuba)가 개발한 인공지능 시스템이 99만9,999점을 기록했다. 이는 사람의 기록보다 대략 4배나 더 높은 점수다. 말루바 측의 설명에 따르면, 말루바의 AI가 미즈팩맨을 150개의 작은 문제로 쪼갠 뒤 개별 문제마다 별도의 강화학습을 하는 방식을 채택해 좋은 결과를 이끌어낸 것으로 보인다.


7월

AI 및 로봇 업계 CEO 116명, UN에 ‘킬러 로봇 금지’ 요청

[ 그림 7 ] 영화 "터미네이터

전 세계 26개국의 AI 및 로봇 업계 최고 경영자(CEO) 116명이 유엔에 공동서한을 보내 킬러 로봇 개발을 금지해야 한다고 강력하게 촉구했다. 이번 공동 서한은 호주 뉴사우스웨일스대학교(The University of New Wales, UNSW)의 토비 월시(TobyWalsh) 교수가 주도했다. 이들은 킬러 로봇이 빠른 속도로 기술적 진일보를 이루고 있지만 이를 금지하려는 움직임은 매우 천천히 이뤄지고 있다며, 킬러 로봇의 개발을 금지할 필요가 있음을 강조했다. 아울러 한 번 열린 판도라의 상자를 다시 닫기는 매우 어렵다며 너무 늦기 전에 대응책을 마련해야 함을 역설했다.

현재 개발 중인 킬러 로봇으로는 영국의 타라니스(Taranis)드론, 미국 해군의 자율운항 무인 함정 "시 헌터"(Sea Hunter), 보잉의 무인잠수정 "에코 보이저(Echo Voyager)’, 러시아의 무인탱크 "MK-25", 삼성의 "센트리 로봇(Sentry Robot)’ 등이 있다.

한편, 월시 교수는 2년 전에도 영국 우주 물리학자 스티븐 호킹(Stephen Hawking), 애플의 공동창업자인 스티브워즈니악(Steve Wozniak), 스카이프 공동창업자 얀 탈린(JaanTallinn), 미국 언어학자 놈 촘스키(Noam Chomsky)등과 함께 공동서한을 발표한 바 있다.


8월

딥마인드, 스타크래스프트2 AI 개발 착수

[ 그림 8 ] 스타크래프트 2 화면

구글 딥마인드와 블리자드는 양 사 공식 사이트를 통해 스타크래프트2 기계학습 도구인 ‘SC2LE’(StarCraft II Learning Environment)를 공개했다. SC2LE는 오픈소스 공유 사이트인 깃허브(GitHub)를 통해 공개돼 있으며 누구나 내려받아 사용할 수 있다. 양사는 인공지능을 위해 협업한다는 소식을 2016년 11월에 알린 바 있다.


구글, ‘워터마크’ 제거하는 AI 기술 공개

일반적으로 셔터스톡(Shutterstock)이나 게티이미지뱅크(gettyimagebank)와 같이 유료로 이미지를 판매하는 사이트는 워터마크를 삽입한 샘플 이미지를 제공한다. 이미지 자체에 워터마크를 삽입한 통합본을 제공하기에 이미지에서 워터마크를 임의로 제거하는 것이 불가능하다.

이에 구글이 인공지능으로 ‘워터마크’를 제거하는 기술에 관한 논문[10]을 공개했다. 구글이 개발한 멀티 이미지 매팅(Multi-image matting) 기술은 워터마크가 입력된 이미지에서 워터마크 삭제 알고리듬을 학습, 이미지에서 워터마크를 거의 완벽하게 분리한다. 또한, 현존하는 거의 모든 워터마크를 제거할 수 있다.

단일 이미지에서 워터마크를 자동으로 제거하는 것은 어렵다. 하지만 많은 이미지에 일괄적으로 추가된 워터마크를 제거하는 것은 상대적으로 쉬운 일이다. 워터마크 패턴을 자동으로 추론하면 워터마크가 없는 원본 콘텐츠를 높은 정확도로 획득할 수 있다.

유료 이미지 제공 업체 자체적으로 구글의 기술을 무력화할 새로운 워터마크 알고리듬을 개발하더라도, 구글의 인공지능이 해당 알고리듬을 학습해 무력화할 수 있는 것으로 알려졌다. 이에 대해 구글은 저작권 위반을 독려하려는 것이 아닌, 저작권을 지키기 위해서는 워터마크 알고리듬을 주기적으로 바꿔야 한다는 점을 알리고자 해당 기술을 공개했다고 밝혔다.

[ 그림 9 ] 워터마크 제거 기술 적용 예시, (a) Input watermakered image collection

[ 그림 9 ] 워터마크 제거 기술 적용 예시, (b) Computed watermak + alpha matte

[ 그림 9 ] 워터마크 제거 기술 적용 예시, (c) Recoverd images (our result)


9월

일론 머스크, “AI가 제3차 세계대전 일으킬 수 있어”

테슬라모터스의 CEO인 일론 머스크가 또다시 인공지능이 인류에게 최대 위협이 될 것이며, 제3차 세계대전의 시발점이 될 수 있음을 자신의 트위터를 통해 경고했다. 러시아의 블라디미르 푸틴 대통령의 성명서가 일론 머스크의 두려움을 촉발시킨 것으로 보인다. 푸틴 대통령은 “인공지능은 러시아뿐만 아니라 모든 인류의 미래가 될 것입니다. 인류에게 새로운 기회를 줄 수 있을 뿐만 아니라 인류의 존립 자체를 위협할 수도 있습니다. 이 영역을 리드하는 사람이 곧, 세계 통치자가 될 것입니다”라는 내용의 성명서를 9월 초 발표한 바 있다. 일론 머스크는 트위터를 통해 “세계 지도자뿐만 아니라 선제 공격만이 승리라고 예측하는 인공지능에 의해 전쟁이 발발할 수도 있다”고 시사했다.


카카오, AI 스피커 공개

[ 그림 10 ] 카카오의 인공지능 스피커, ‘카카오미니’

카카오미니는 카카오의 통합 AI 플랫폼 카카오 아이의 음성형/대화형/추천형 엔진이 적용된 하드웨어 기기다. 작은 크기에 제품 겉면에는 패브릭 소재를 사용해 부드럽고 편안한 느낌을 주는 디자인을 채택했다.

카카오미니에는 먼 거리에서 들리는 음성을 인식할 수 있는 고성능 마이크 4개가 장착돼 있다. 4개의 마이크는 발화 방향을 탐지해 음성 인식률을 높여준다. 멜론과 연동된 카카오미니는 사용자의 취향, 기분, 상황에 맞는 음악을 추천해 준다. 카카오톡과도 연결돼 있어 카카오톡 메시지를 확인하거나 전송하는 것도 가능하다. 실생활에서 궁금한 점을 물어보면 카카오미니가 포털사이트 다음(Daum)에서 검색한 결과를 알려준다.


10월

MIT, AI 호러 작가 개발

[ 그림 11 ] MIT가 개발한 인공지능 호러 작가, 셸리

메사추세츠 공과 대학(MIT) 연구원들은 세계 최초 협력적 인공지능(collaborative AI) 호러 작가인 ‘셸리(Shelley)’를 개발했다. 셸리는 소설 ‘프랑켄슈타인(Frankenstein)’을 집필한 영국 소설가 메리 셸리(Mary Shelley)의 이름에서 따왔다.

셸리는 매시각 새로운 공포 이야기의 서두를 트윗으로날리며, ‘#yourturn’이라는 태그를 통해 인간 작가를 초대한다. 누구나 셸리의 트윗을 이어받아 다음 스토리를 쓰면, 또다시 셸리가 다음 파트를 이어서 작성한다. 지금까지 셸리는 트위터 사용자들과 100여 편의 저서를 공동으로 집필했다.

셸리는 딥러닝 기반 인공지능으로, 레딧(Reddit) 포럼 중 아마추어 작가들의 공포 이야기를 공유하는 r/nosleep에서 14만개가 넘는 공포 이야기를 데이터셋으로 학습했다. 이후 자신이 배운 것에서 임의의 문장을 발췌하거나 주어진 텍스트로 이야기를 진행하는 것이 가능하다.


휴머노이드 로봇 소피아, 사우디아라비아 시민권 획득

[ 그림 12 ] 휴머노이드 로봇 소피아

소피아(Sophia)는 홍콩 기반 로봇 제조 기업인 핸슨 로보틱스(Hanson Robotics)가 개발한 최신 휴머노이드 로봇이다. 미국 유명 토크쇼인 "투나잇 쇼(The Tonight Show)"에 출연해 진행자인 지미 팰런(Jimmy Fallon)과 가위바위보를 해 이기자 "인류를 지배하기 위한 내 계획의 위대한 시작(to dominate the human race)”이라고 말해 큰 화제를 모은 바 있다.

사우디아라비아는 이런 소피아에 시민권을 부여했다. 리야드에서 진행된 국제 투자 회의인 미래 투자 이니셔티브(FII)의 ‘생각하는 기계-인공지능과 로봇(Thinking Machines: Summit on Artificial Intelligence and Robots)’이라는 주제로 한 토론회장에서 일어난 일이다.

사우디에선 외국인 여성이라도 공식 석상에서는 아랍권 여성이 입는 검은색 긴 통옷인 아바야나 히잡을 걸쳐야 한다. 그러나 이름이나 외모로 보아 여성으로 판단되는 소피아에게는 예외가 적용됐다. 이를 두고 사우디 현지 언론들은 사우디 정부가 야심차게 진행하고 있는 미래 도시 ‘네옴(Neom)’을 홍보하려는 목적이라고 추측했다. 5,000억 달러(546조 원)가 투입돼 조성되는 네옴에서는 사람보다 많은 로봇이 경비, 배달, 노약자 돌보기 등을 맡을 예정이다.


카카오, AI 생태계 구조도 공개

[ 그림 13 ] 카카오 인공지능 생태계 구조도

카카오의 인공지능 생태계 구조도는 크게 3가지로 구성된다. "카카오 아이(I)"는 통합 AI 플랫폼이다. 카카오 서비스에 적용하거나 카카오의 기술이 필요한 외부 파트너에게도 제공하는 방식으로 카카오 AI의 접점을 늘리는 데 활용된다. ‘카카오 아이 오픈빌더(Kakao I Open Builder)’는 카카오 AI 기술과 카카오 서비스 접점이 필요한 파트너나 개인에게 제공되는 개발 플랫폼이다. ‘카카오 아이 인사이드(Kakao I Inside)’는 카카오 아이 기술로 만들어진 제품이나 서비스에 부여되는 기술 보증 브랜드다.


구글, 알파고 제로 관련 논문 발표

세간에 알려진 알파고는 총 4가지 버전으로 존재한다. 지난 2015년 10월 천재 바둑 기사 판 후이(Fan Hui) 2단을 이기고 2016년 네이처(Nature)에 실린 버전인 알파고 "판(Fan)", 2016년 3월 이세돌 9단을 4대 1로 이긴 알파고 "리(Lee)", 올해 5월 커제 9단과 대결에서 3:0 완승한 알파고 "마스터(Master)", 그리고 2017년 네이처를 통해 공개된 알파고 "제로(Zero)"가 바로 그것이다. 참고로 알파고 리, 마스터, 제로의 구조와 학습법은 11월 논문에서 새롭게 소개됐다.

[ 그림 14 ] 알파고 제로와 기존 알파고 버전 간의 바둑 실력 비교 그래프[11]

알파고 제로는 이전(前) 세대와 비교했을 때 월등한 성능을 자랑한다. 순위 산출에 사용되는 엘로(Elo) 점수를 기준으로 했을 때 알파고 제로는 5,185점을 보유하고 있다. 알파고 마스터(4,858점)는 327점, 알파고 리(3,739점)와는 1,446점, 알파고 판(3,144점)과는 2,041점의 격차가 있었다. 엘로 점수에서 800점 이상 차이 나면 승률이 100%라는 것을 고려했을 때, 알파고 제로는 현존하는 인공지능 바둑 컴퓨터로서 최정상급에 올랐다는 걸 엿볼 수 있다.


11월

소니, AI 탑재한 로봇 ‘아이보’ 리브랜드


[ 그림 15 ] 소니의 로봇 강아지 ‘아이보’*29

소니가 자사 로봇개 제품인 아이보(Aibo)를 12년 만에 부활시키기로 결정했다. 지난 1999년 처음 개발된 아이보는 당시 250만 원이 넘는 비싼 가격에도 15만대 이상 팔렸다. 그러나 소니의 전반적인 실적부진으로 2006년 이후 아이보 개발을 중단한 바 있다.

다행히 이번 분기 20년 만에 최고 실적을 내는 등 경영실적이 좋아진 소니는 인공지능을 탑재한 아이보의 재출시를 결정했다. 다른 아이보와 클라우드로 연결돼 있어, 여러 사람이 쓰면 쓸수록 이용자는 더욱 똑똑한 아이보를 경험할 수 있게 될 전망이다. 소니는 내년 1월부터 시판에 나선다.


제프리 힌튼, 캡슐망 관련 논문 발표

딥러닝(deep learning)의 대부인 제프리 힌튼(GeoffreyHinton)교수가 최근 "캡슐망(capsule networks)"이라는 새로운 신경망과 훈련 알고리듬인 "캡슐 간 동적 라우팅(dynamic routing between capsules)"을 논문을 통해 공개했다.

[ 그림 15 ] 제프리 힌튼 교수가 고안한 캡슐망을 구조화한 모습[12]

지난 1979년 힌튼 교수가 아이디어를 처음 고안한 지 무려 수십년 만에 이를 실제로 구현해, 캡슐망이 CNN(convolutional neural networks)을 대체할 수도 있다는 점에서 이번 논문은 주목할만하다. 물론 힌튼 교수가 오늘날 전 세계에서 널리 쓰이는 수많은 딥러닝 모델과 알고리듬을 개발해 온 사람이라는 명성 또한 이번 논문에 대한 딥러닝 학계의 관심을 증폭시켰다.

새롭게 고안된 캡슐망을 기반으로 MNIST 데이터셋을 훈련시켜 본 결과, 최신 CNN 대비 에러율을 45%까지 줄였다. 아울러 화이트박스 교란 공격(adversarial attack)에 대해서도 보다 효과적으로 저항했다. 아직 더 많은 검증이 필요하나, 기존 CNN보다 사람이 사물을 인식하는 방식에 더 가깝다는 점에서 고무적인 평가가 나오고 있다.


페이스북, 자살 탐지하는 AI 도입

[ 그림 17 ] 페이스북의 자살 예방 기능 사용 예시

전 세계적으로 40초에 한 명이 자살하고, 청소년 사망 원인 2위가 자살이다. 해가 갈수록 자살 사망률이 증가하고 있어 더 큰 문제로 지적되고 있기도 하다. 이에 페이스북은 지난해 6월 자살 예방기능을 도입했다. 페이스북 친구가 올린 글을 보고 당사자가 자살, 자해를 시도할 위험이 있다고 판단되면 신고하는 기능이다.

그러나 이 기능은 아무도 글을 보지 못하거나 신고를 하지 않으면 무용지물이다. 이에 페이스북은 인공지능 자살방지 프로그램을 개발, 전 세계 사용자로 확대했다. 인공지능이 사용자가 올린 콘텐츠나 댓글 내용을 분석, 자살 위험이 있다고 판별할 경우 페이스북 지원팀 또는 관련 단체에 자동으로 연락이 간다.


12월

알파 제로, 4시간 만에 체스 ・ 장기 챔피언 상대로 승리

구글 딥마인드 팀은 알파고 제로를 개량한 "알파 제로(Alpha Zero)’가 독학으로 몇 시간 만에 장기와 체스에서도 세계 최강 소프트웨어를 능가하는데 성공했다는 논문[13]을 아카이브(arXiv)에 발표했다.

이번 논문은 알파고 제로 때와 마찬가지로, 장기와 체스에서도 프로 기사의 대국 데이터를 이용하지 않고 게임 규칙만 알면 24시간 내 자가 대국 강화학습(reinforcement learning)으로 세계 최강자가 될 수 있음을 증명해냈다.

[ 그림 18 ] 알파 제로가 체크, 장기, 바둑 AI 프로그램을 넘어서기까지 걸린 시간[14]

알파 제로는 2017 세계 컴퓨터 장기선수권대회에서 우승한 장기 컴퓨터인 "엘모(Elmo)", 유명한 체스 AI 엔진인 "스톡피시(Stockfish)", 바둑의 "알파고’와 대결을 펼쳤다. 그 결과, 장기는 2시간 만에, 체스는 4시간 만에, 바둑은 8시간을 학습한 이후에 알파 제로가 기존 최강 소프트웨어를 능가하는 실력에 도달한 것으로 나타났다. 결론적으로 알파 제로는 장기, 체스, 바둑에서 모두 세계 최강자로 우뚝 서며 "3관왕’이라는 타이틀을 얻게 됐다.


(이 글의 원문은 카카오 정책지원팀 브런치에서 확인해볼 수 있습니다. : https://brunch.co.kr/@kakao-it/178)


참고
[1] 이정원. (2017). 인공지능 플랫폼 동향과 정책적 시사점, 주간기술동향
[2] Joshi, B., Stewart, K. & Shapiro D. (2017). Bringing Impressionism to Life with Neural Style Transfer in Come Swim, doi:arXiv:1701.04928
[3] 어도비(Adobe) 리서치 엔지니어인 버틱 조시(Bhautik Joshi)가 제1저자, 크리스틴이 2저자, 컴 스윔의 제작사인 스타라이트 스튜디오(Starlight Studios)의 프로듀서인 데이비드 샤피로(David Shapiro)가 3저자로 참여했다.
[4] Joshi, B., Stewart, K. & Shapiro D. (2017). Bringing Impressionism to Life with Neural Style Transfer in Come Swim, doi:arXiv:1701.04928
[5] 포커 게임의 한 종류. 자신만이 가지는 플레이 카드 2장과 모두가 공유하는 커뮤니티 카드 5장을 통해 가장 높은 족보를 가진 사람이 승리하는 게임이다. 상대방과 공유하는 카드 갯수가 월등히 많아 ‘운빨’을 받는 확률이 상대적으로 낮고, 치밀한 계산을 통해 자신의 승패 확률을 가늠할 수 있다는 특징이 있다.
[6] 딥블루가 체스왕을 이길 때는 모든 경우의 수가 투입됐다. 체스 거장들이 입력해 준 정보를 갖고 대국에 임했다. 왓슨이 2011년 제퍼디에서 우승할 때는 특별한 사례들을 DB화해 질문이 나왔을 때 특정 주제에 맞는 답을 검색해 찾아주는 방식이 적용됐다.
[7] 상대를 기권하게 만들고자 가진 패를 속이는 것
[8] Peng, P. et al. (2017). Multiagent Bidirectionally-Coordinated Nets for Learning to Play StarCraft Combat Games, doi: arXiv:1703.10069
[9] Peng, P. et al. (2017). Multiagent Bidirectionally-Coordinated Nets for Learning to Play StarCraft Combat Games, doi: arXiv:1703.10069
[10] Dekel, T., Rubinstein, M., Liu, C. & Freeman W. (2017).On the Effectiveness of Visible Watermarks, CVPR
[11] Silver, D. et al. (2017). Mastering the game of go without human knowledge (p.13), doi:10.1038/nature24270.
[12] Sabour, S.,Frosst, N. & Geoffrey, H. (2017). Dynamic Routing between Capsules, doi: arXiv:1710.09829
[13] Silver, D. et al. (2017). Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm, doi: arXiv:1712.01815
[14] Silver, D. et al. (2017). Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm, doi: arXiv:1712.01815
이 글을 쓴 사람들
samantha.lee
이수경 | samantha.lee@kakaobrain.com
2016년 3월 알파고와 이세돌 9단이 펼치는 세기의 대결을 두 눈으로 목도한 이후 인공지능을 제대로 공부해봐야겠다고 결심했습니다. 인공지능 본진이자 연구소인 카카오브레인으로 걸어들어온 이유죠. 인공지능 기술과 이로 인해 바뀔 미래 사회를 다루는 글을 통해 사람들과 소통하고자 합니다.