연구원 인터뷰
인공지능을 사랑하는 수학자의 ‘여행기’
2018/12/06 by 임성빈 이수경

안녕하세요, 카카오브레인의 인공지능 연구원, 임성빈입니다.


"인간이 의사결정을 하는 패턴’을 알고자 사회과학을 전공했습니다”

부모님은 제가 법대에 진학해 변호사가 되길 원했습니다. 이런 바람과는 달리 저는 과학고에 진학했습니다. 수학과 과학을 원없이 공부할 수 있는 곳에서라면 제가 원하는 삶의 방향을 찾을 수 있을 거로 판단한 거죠. 하지만 학교가 모든 걸 해결해주지는 않더라고요. 수업 때마다 눈을 반짝이며 어느 공대에 가서 어떤 전공을 하고 싶다며 자신의 꿈을 구체적으로 말하는 친구들과는 달리, 저는 제가 무엇을 좋아하는지 도통 알 수가 없었습니다. 이걸 자각한 뒤로 앞으로 무엇을 하면 좋을지를 고민하며 저만의 세계를 구축해나가기 시작했어요. 점차 공학도가 아닌 길에 눈이 텄죠. 궁극에는 ‘사람의 의사결정은 어떻게 이뤄지는가?’라는 주제로 심오한 탐구를 시작했습니다.

그 당시 ‘문명(civilization)’이나 ‘대항해시대’ 등 장기적인 전략을 세워 무엇인가를 자유롭게 실행하는 게임을 즐겨 했습니다. 상대방을 이기는 걸 목표로 하는 ‘바둑’이나 ‘스타크래프트’와 같은 게임에서는 각 행동에 대한 보상(reward)을 파악해 가며 올바른 수를 둬야 해요. 반면, 제가 즐기던 게임에서는 해적이나 무역상, 세계 일주를 하는 탐험가와 같은 역할을 설정하고, 이 역할에 따른 목적을 달성하는 데 주안을 둡니다.

저는 사람들이 게임을 진행하는 방식에 주목했어요. 목적에 따른 플레이 방식이 사람 수만큼 천차만별일 것이라는 일반적인 인식과는 달리, 플레이 방식은 훨씬 더 적은 가짓수로 분류할 수 있어요. 즉, 사람이 무엇인가를 결정해나가는 방식에는 패턴이 존재한다는 의미입니다. 저는 이 패턴을 물리학의 이론처럼 설명할 수 있겠다 싶었습니다. 물리 입자와 같은 고유한 특성이 의사결정 방식에도 있을 거로 판단, 관련된 이론을 찾고자 도서관을 쉼 없이 들락날락했어요. 이런저런 책을 미친 듯이 빌려본 끝에 사회과학에서 그 답을 찾을 수 있겠다는 결론에 이르렀습니다. 이과생이었던 저는 대학은 문과(고려대학교 정경대학)로 진학했습니다. 


"사회과학의 꽃이 수학이란 걸 발견했어요”

경제학에서는 사람을 ‘합리성으로 똘똘 뭉친 기계적인 인간’으로 정의합니다. 모든 경제 활동을 합리적인 인간의 의사결정의 결과물로 간주하는 거죠. 이 합리성을 분석하기 위해서는 수학이 필요합니다. 경제학과 대학원생이 안드레우 마스-콜레이(Andreu Mas-Colell)의 저서 미시경제이론(microeconomic theory)이라는 교과서를 보려면 대학 수준의 수학지식이 필요했기 때문이죠. 이를 위해 당시 유학을 준비하던 경제학과 선배들은 수학과 대학원 수업을 병행해야만 했죠.

비단 경제학을 통해서만 수학의 중요성을 깨달은 게 아니에요. 정치학과 사회학에서도 그 중요성을 발견했습니다. 두 학문은 사회적 집단이나 정당, 국가의 행동을 게임이론(game theory)로 분석합니다. 이 게임이론은 그 자체가 수학입니다. 수학자 폰 노이만(John von Neumann)이 경제학자 오스카 모겐스턴(Oskar Morgenstern)과 함께 창안했죠. 특히 게임이론에서 내쉬균형(nash equilibrium)은 정말 중요한 개념입니다. 내쉬균형은 영화 <뷰티풀 마인드(Beautiful Mind)>에서 러셀 크로우(Russell Crowe)가 연기한 수학자 존 내쉬(John Nash)가 고안했습니다. 아시다시피 존 내쉬는 내쉬균형을 고안한 업적으로 노벨경제학상을 받았죠.

금융학(finance theory)을 통해서도 수학의 위상을 다시 한번 깨달았어요. 개인 또는 집단의 의사결정(또는 욕망) 결과물을 가장 적나라하게 볼 수 있는 곳이 금융시장이라서 자연스럽게 관심을 두게 됐죠. 사람들은 욕망과 공포심에 휘둘려서 금융 투자에 실패한다고 흔히 말해요. 하지만 이런 감정에 휘둘리지 않는 컴퓨터가 만든 정교한 규칙에 따라 금융 거래를 하면 장기적인 관점에서 이익을 볼 수 있겠다고 생각했어요. 이런 규칙을 짤 땐 제어 이론(control theory)이 필요한데요, 이 이론 또한 수학에 근거를 두죠.

이처럼 사회과학을 통해 수학의 중요성을 발견한 저는 수학과 대학원에 진학했습니다. 


수학자, 머신러닝에 빠져들다

지난 2013년 대학원생 시절 머신러닝(machine learning)을 처음 접했습니다. 저는 머신러닝을 기존의 통계학 기반 방법론을 대체하는 새로운 것으로 인식했을 뿐, 그 결과물이나 응용 가능 분야에는 크게 관심을 두지 않았습니다. 경제학이나 금융공학과 비교했을 때 머신러닝에서는 수학이 많이 쓰이질 않아요. 그래서 머신러닝에 사용되는 수학적 기법이 매우 단순하다고 생각했죠. 하지만 머신러닝은 기존의 방식보다 훨씬 뛰어난 결과물을 선보입니다. 그 원리를 파헤쳐보고자 머신러닝을 이론부터 들여다보기 시작했어요. 공부하면 할수록 머신러닝의 매력에 빠졌고, 이론만 파기보다는 실제 데이터에 적용해보자는 생각이 들었습니다. 학위를 받고 박사후과정(post-doc)을 걷는 대신 기업에서 일하는 길을 선택한 배경입니다.

첫 직장은 보험사였어요. 저는 새로 개발하는 상품에 들어가는 담보의 보험료를 산출하는 팀에 소속됐습니다. 이 보험료 산출하는 데 사용하는 지표 중 하나가 위험률입니다. 이 위험률은 비즈니스 로직(보장 기간, 보상액 등)에 따른 가입자의 패턴을 토대로 산정돼요. 보험을 판매한 순간 이후부터 보상 프로세스가 가동될 수 있도록 가입자가 사고를 당하면 어떤 절차를 밟도록 안내해야 하는지, 어떤 증빙 자료를 받을지도 위험률에 반영합니다. 해당 보험상품을 마케팅했을 때 거두는 효과와 비용을 시뮬레이션한 결과를 반영하는 등 일련의 복잡한 과정을 거쳐서 최종적으로 위험률을 산출합니다.

입사 7개월 차에 접어들었을 무렵 뇌졸중 재진단 담보를 만드는 프로젝트에 투입됐습니다. 저는 회사 데이터베이스(DB)에 저장된 환자의 자기공명영상(MRI)과 컴퓨터단층촬영(CT) 데이터를 분석하는 일을 맡게 됐죠. 사람이 검토해야 할 데이터 자체가 방대해서 상당한 업무로드가 발생했습니다. 이를 효율적으로 줄이는 데 있어서 딥러닝으로 의료 영상을 판독하는 소프트웨어가 유용하겠다 싶었습니다. 하지만 회사 내에서는 딥러닝 모델을 공부해서 만들 수 있는 상황이 여의치가 않았습니다.

‘딥러닝을 공부해야겠다’는 생각이 머릿속을 가득 메웠을 때 “데이터를 만질 줄 알아야 (딥러닝 관련된) 공부든, 일이든 제대로 시작할 수 있다"는 민현석 박사의 조언을 듣고 인공지능 분야에 뛰어들어야겠다는 결심이 섰습니다. 컴퓨터 영상 분야 전문가인 민 박사는 알파고(AlphaGo) 등장 이전부터 딥러닝에 관한 통찰력을 나눠 준 분이죠. 그 후 민 박사님과 함께 한 의료 인공지능 스타트업 합류했습니다.

이 스타트업에서 6개월간 근무하며 맡았던 일은 전립선암 환자의 병리 영상을 판독한 후 생존 분석(survival analysis)을 수행하는 모델을 개발하는 거였어요. 보험사에서 질병, 상해 등 의료에 관련된 분야에서 생존 분석을 실무적으로 다뤄본 경험이 큰 도움이 됐죠. 생존 분석은 환자가 지금부터 앞으로 얼마나 생존할 수 있는지를 예측하는 방법론을 의미해요. 전문적으로 말하자면 환자의 성별, 연령, 이전에 받은 치료(방사능, 화학 등) 등을 모두 고려해 병기(예 : 암 초기, 중기, 말기 등)를 예측하는 거죠. 이 생존 분석은 의료통계학에서 매우 중요한 주제에요. 임상의에게 그 효용성을 증명하는 수단이기 때문입니다.


“머신러닝 이론을 연구하고자 카카오브레인에 합류했습니다”

스타트업에서 딥러닝 연구와 개발을 동시에 경험하면서 의료 도메인에 국한되지 않은, 머신러닝 이론 자체를 연구하고 싶다는 갈증을 느끼게 됐습니다. 우리가 흔히 CNN, RNN, GAN이라고 부르는 모델을 한 번 보세요. 특정 도메인에 특화된 게 아니라 전 범위에 걸쳐 널리 쓰이고 있잖아요. 이처럼 의료와는 독립되면서도 엔지니어에게 도움이 되는 모델을 만들어보고 싶어졌어요. 개발에 우선순위를 두는 스타트업보다는, 연구에 집중할 수 있는 회사로의 이직을 결심하게 된 배경입니다.

인공지능 스타트업에서 퇴사한 2017년 7월부터 5개월간 딥러닝 연구자와 자유롭게 교류하기 시작했어요. 이 시기에 가장 많이 만난 사람 중 한 명이 바로 최성준 박사입니다. 여타 다른 공학자와는 달리, 최 박사는 수학에 관한 문제를 진지하게 바라보며 호기심 어린 눈으로 질문을 던지더라고요. 저에게는 정말 인상 깊은 면모였습니다. 아이디어가 통한다고 판단한 저는 최 박사와 딥러닝으로 불확실성(uncertainty)을 계측하는 모델을 고민해보기 시작했습니다. 당시 미국 디즈니 연구소에서 인턴 중인 최 박사가 밤(한국 시각)에 논문을 쓰면, 제가 낮에 이어서 썼죠. 정말 재미있게 연구했습니다. 그렇게 쓴 논문(Uncertainty-Aware Learning from Demonstration Using Mixture Density Networks with Sampling-Free Variance Modeling)을 ICRA에서 발표했습니다.

딥러닝 커뮤니티와 교류하면서 머신러닝 코어와 로보틱스를 연구에 필요한 몇 가지 요소를 꼽게 됐어요. 새로운 분야에 도전하다 보면 시행착오를 겪는 것은 너무나 당연한 일이에요. 따라서 연구 주제에 관해 자유롭게 토론할 수 있는 동료와 함께 다양한 실험을 진행할 수 있느냐가 정말 중요하다고 볼 수 있죠. 연구원을 신뢰하는 카카오브레인의 자율적인 기업문화라면 제가 원하는 환경에서 연구를 진행할 수 있겠다고 판단했습니다.

카카오브레인에 합류한 저는 연구원으로 정말 즐겁게 일하고 있습니다. 머신러닝 연구 및 논문 리뷰가 주 업무입니다. 그 외에 수학, 그중에서도 확률론을 전공한 저는 모델에 들어가는 수학적, 통계적 기법을 직접 구현하기도 합니다. 다른 연구원을 위해 세미나도 열어요. 최근 쏟아지는 논문에 수식이 많다 보니 배경지식이 없으면 이해하기 어려운 상황도 종종 발생하기 때문이죠. 의료영상, 로보틱스, 컴퓨터 비전 등 머신러닝 코어 외 응용 분야에서 외부 팀과 공동 연구도 진행합니다.


“인공지능 대중화에 공헌하고자 합니다”

인공지능이 널리 사용되기 위해서는 뛰어난 성능을 자랑해야 함은 물론, 머신러닝에 대한 전문적인 지식 없이도 접근할 수 있어야 합니다. 그러기 위해서 인공지능 개발을 위한 자동화 도구(AutoML)가 필요하다는 생각에 카카오브레인에서 AutoML 분야를 집중적으로 연구하고 있죠.

그러나 성능만 뛰어난 인공지능은 대중화에 한계가 있습니다. 기존의 머신러닝은 주로 변수와 결과 간의 상관관계를 통해서 예측합니다. 하지만 이 방식에는 전문가가 아닌 한 AI가 문제를 해결하는 과정을 이해하기 어렵다는 문제가 있죠. 판단의 근거를 설명할 수 없다면 잘못된 결정이 특히 인간에게 큰 피해를 줄 수 있는 로보틱스나 의료 분야에 인공지능을 광범위하게 도입하기는 어려울 것입니다.

하지만 ‘의사결정에 결정적인 영향을 미치는’ 변수와 결과 간의 인과관계를 추론하는 Causal ML을 이용한다면 인공지능의 판단 근거를 제시할 수 있게 됩니다. 이 방법론은 공공기관이나 회사에서 사회적으로 중요한 정책을 검토할 때 사용해볼 수 있죠. 저는 이처럼 인과관계를 추론(causal inference)하는 머신러닝을 연구해보고자 합니다.

제가 롤모델로 삼는 수학자가 한 분 있습니다. 바로 레오 브레이만(Leo Breiman)이죠. 그는 랜덤 포레스트(random forest) 알고리듬을 만든 것으로 유명한 분입니다. 카카오브레인에서 사용하는 닉네임을 레오(Leo)라고 지은 건 그분에 대한 존경심을 표현하기 위해서죠. 레오 브레이만처럼 인공지능 대중화에 기여하는 게 저의 궁극적인 인생 목표입니다.


이 글을 쓴 사람들
leo.brain
임성빈 | leo.brain@kakaobrain.com
수식과 증명을 사랑하던 수학자가 로보틱스와 인공지능의 매력에 빠지게 되었습니다. 카카오브레인에서 수학과 엔지니어 사이의 가교 역할을 담당하는 리서치 사이언티스트로 활동하고 있습니다. 안전하고 신뢰도 높은 인공지능을 개발해 우리 사회를 보다 윤택하게 만들고 싶습니다.
samantha.lee
이수경 | samantha.lee@kakaobrain.com
2016년 3월 알파고와 이세돌 9단이 펼치는 세기의 대결을 두 눈으로 목도한 이후 인공지능을 제대로 공부해봐야겠다고 결심했습니다. 인공지능 본진이자 연구소인 카카오브레인으로 걸어들어온 이유죠. 인공지능 기술과 이로 인해 바뀔 미래 사회를 다루는 글을 통해 사람들과 소통하고자 합니다.