2015년 10월 21일 수요일

딥러닝이 로봇을 똑똑하게 할 수 있을까


이 글은 한국인터넷진흥원과 테크M에 기고한 글을 백업한 글입니다. 

딥러닝에 의해 특정 화가풍의 스타일로 재탄생한 이미지들
(사진출처: A Neural Algorithm of Artistic Style)
2000년대 중반 이후 인공지능은 길었던 암흑기를 지나 빠른 속도로 발전하고 있는 모습이다. 그 선두에는 인터넷 사용자들에 의해 축적된 방대한 양의 데이터와 이를 활용 가능케하는 기계학습 방법론, 특히 딥러닝[1]의 역할이 크다. 딥러닝은 기존의 기계학습 방법들과 달리 학습에 필요한 피쳐(feature)들을 스스로 학습함으로써 진정한 “이해”를 위한 인공지능에 한걸음 다가섰다고 평가되고 있으며, 최근 몇년 새 딥러닝은 이미지인식, 음성인식, 자연어처리 등에서 새로운 표준으로 빠르게 잡고있다.

다른 영역에서도 딥러닝의 성공을 본받아 이를 활용하려는 움직임이 거세다. ‘인공지능’이라는 공통분모를 지닌 로봇공학 분야 역시 이 새로운 흐름의 기로에 놓여있다. 하지만, 일반인들의 예상과는 달리, 로봇의 인공지능은 딥러닝의 빠른 발전속도와는 아직 거리를 두고있는 모습이다. 여기에는 몇 가지 이유가 있다, 

첫째, 기계학습은 로봇 인공지능을 구성하는 일부분일 뿐이란 점이다. 사람들이 흔히 로봇의 인공지능을 얘기할 때 로봇이 자율적으로 행위를 통해 작업 목적을 달성하는 모든 과정을 그린다. 이 의미에 해당하는 로봇의 인공지능은 기계학습에서 다루어지는 인식(perception)분야 뿐만 아니라, 미션 수행을 위한 계획(plan)을 세우고 로봇 몸체를 제어(control)하여 행위(action)에 이르는 과정까지 모두를 포함하며, 이 과정에서 발생할 수 있는 외부와의 상호작용(interaction) 역시 매우 중요한 부분을 차지한다. 따라서 비록 최근 기계학습(또는 딥러닝) 분야가 눈부신 발전을 이루고 있다고는 하지만 이 발전의 직접적 혜택을 보는 곳은 인식기술을 중심으로 한 로봇비전 등의 한정적 분야일 뿐이며, 따라서 일반인이 기대하는 “로봇 인공지능의 실현” 단계까지는 다른 부분들의 비약적 발전도 동반되어야 할 것으로 보인다. 

소프트뱅크가 아데바란로보틱스와 손을 잡고 개발한 감정로봇 페퍼 (사진출처)
로봇공학 분야가 딥러닝의 발전 혜택을 받지 못하고 있는 두 번째 이유는 빅데이터와 실시간성의 부재이다. 딥러닝은 일반적인 기계학습 방법보다 훨씬 더 많은 학습 파라미터가 존재한다. 최적의 파라미터를 찾아 딥러닝의 이점을 충분히 활용하기 위해서는 방대한 양의 데이터(e.g. 수천만개의 이미지)와 충분한 트레이닝 시간(e.g. 1주 간의 트레이닝)이 필요한데, 이 두가지 모두 로봇에겐 아직 큰 걸림돌로 남아있다. 

우선 딥러닝을 수행할 만큼 로봇에 대한 방대한 데이터가 쌓여있지 않다. 성인이 신생아일 때에 비해 충분한 지능과 운동능력을 갖추게 된 것은 수많은 경험의 역할이 컸을 것이다. 인간의 신경과학에서 착안했다는 딥러닝 역시 이와 마찬가지로 뛰어난 성능을 위해선 매우 많은 양의 경험(데이터)를 필요로 한다. 하지만 로봇의 경우엔 아직까진 이렇다할 표준화된 하드웨어나 이를 통해 수집된 빅데이터가 존재하지 않다는 것이 현실이며, 따라서 각 연구자들은 스스로 데이터를 수집하고 이를 이용해 연구하는 수준으로 기계학습 학계에서 공공데이터를 놓고 성능 경쟁을 펼치며 비약적인 발전을 이룩한 것과는 거리가 있는 모습이다. 따라서 로봇 인공지능의 발전을 위해선 우선 표준화 된 로봇데이터의 수집과 공유 시스템이 선행되어야 할 것이다. 

딥러닝 적용의 또 한가지 문제는 바로 실시간성의 부재이다. 딥러닝은 빅데이터를 이용해 최고의 성능을 보여준다고는 하나 로봇에겐 소수의 데이터를 이용한 빠른 판단을 하는 것이 더 요구될 때도 많다. 따라서 아직까지는 딥러닝보다도 베이지안 추론을 중심으로 한 인공지능이 더 우위에 있는 모습이며, 따라서 최근 딥러닝의 비약적인 발전에도 이것이 로봇 인공지능의 발전으로 이어지기까지는 몇 단계의 고비가 더 남아있는 것으로 보인다.

구글의 무인자동차 (사진출처)
하지만 이러한 한계에도 불구하고 이를 극복하려는 모습이 최근 로봇공학계에서 나타나고 있다. 인식기술을 넘어 딥러닝을 제어에도 활용하려는 시도가 UC버클리 피터 아빌(Peter Abbeel)교수 등에 의해 시도되고 있으며[2], 로봇 스스로 행위시도-실패를 거듭하며 교훈을 얻어나가는 강화학습방법(reinforcement learning) [3] 역시 딥러닝과 긴밀한 연관성을 가지며 매우 빠른 발전을 이룩하고 있다. 이러한 시도들을 비추어 본다면 학자들이 궁극의 학습 로봇이라 여기는 평생학습로봇(Lifelong learning robot)도 해결의 실마리가 보이지 않을까 기대가 크다.

또 한가지 긍정적인 움직임은 산업계에서 이루어지고 있다 - 바로 거대 기업들이 적극적으로 로봇에 대한 빅데이터 수집에 나섰다는 것이다. 일본의 소프트뱅크는 노령화 사회를 겨냥한 감정로봇 페퍼를 약 184만원의 매우 저렴한 가격에 판매했는데 발매 1분 만에 1차 물량이 매진될 정도로 반응이 뜨거웠다고 한다.[4] 원가에도 미치지 못할 것으로 보이는 저렴한 가격의 배경에는 빠른 보급을 통해 빅데이터를 수집하여 감정로봇의 진화를 꿈꾸려는 소프트뱅크의 전략이 숨어있다. 구글 역시 무인자동차 오랜기간의 시범주행을 통해 각종 돌발상황에도 대처할 수 있는 빅데이터를 수집하고 있으며[5], 사물인터넷 기업을 적극적으로 인수하며 인터넷 공간을 넘어 인간의 생활에서도 데이터를 수집하고 공략하려는 시도를 펼쳐나가고 있다.

이와 같이 현재는 딥러닝의 발전에 비해 더딘 발걸음을 보이는 로봇 인공지능의 모습에도 불구하고 로봇인공지능 역시 로봇 하드웨어의 표준화, 데이터의 수집 및 공유 시스템의 보편화, 거대 기업의 집중적 투자가 병행될 시 빠른 발전을 이룩하는 시기가 곧 올 것임을 예측할 수 있다. 이에 따라 노동시장에서 인력이 자동화 시스템으로 대체되는 속도 역시 가속화될 것이며, 따라서 인공지능 로봇의 정착은 기술의 발전속도가 문제가 아니라 오히려 그것을 받아들이는 사회적 합의의 속도에 따라 그 시대의 도래 시기가 결정되지 않을까 예측해본다.

마지막으로 인간과 인공지능 로봇의 공존 가능성에 대해 한가지 언급하자면, 인간의 비교 우위는 미래엔 더이상 “지능”에 있지 않을 가능성이 크다. 현재에도 이미지 인식 기술은 사람의 인식 에러율을 뛰어 넘었으며 (예를 들어, 알고리즘보다 사람이 사진 속 사람얼굴을 잘못 알아볼 가능성이 더 크다.) 미래엔 알고리즘이 인간지능을 압도하는 시대가 올 것이다. 오히려 인간의 강점은 역설적이게도 몸의 자유로운 움직임에 있을지도 모른다. 최근 미국에서 펼쳐진 최고성능의 휴머노이드 로봇들의 대결, 다르파 로봇챌린지 (DARPA Robotics Challenge 2015)[6]/에서도 볼 수 있었지만, 로봇의 운동능력은 아직 인간의 그것에 한참 미치지 못한다. 어쩌면 실로 위대한 것은 인간의 지능이 아니라 수많은 근육을 자유자재로 컨트롤하는 인간의 몸일지도 모르며, 이 강점을 활용한 노동직업군이 오히려 대체불가능 직업군으로 남을 가능성이 크다. 결국 미래 노동시장은 인공지능을 개발하고 제어하는 상위 직업군과 인공지능 로봇이 소화하지 못하는 부분을 도맡는 하위 직업군으로 양극화 될 가능성이 크며, 이를 대비한 사회적 제도 기반의 마련이 필요할 것이다.[7] 

[참고문헌] 
[1] Y. LeCun, Y. Bengio and G. Hinton, Deep Learning, Nature, 521.7553: 436-444, 2015. 
[2] A. Punjani and P. Abbeel, Deep Learning Helicopter Dynamic Model, In proc. of the IEEE Int’l Conf. on Robotics and Automation (ICRA) 2015. 
[3] V. Mnih, K., Kavukcuoglu, D. Silver, A. Rusu, J. Veness, M. Bellemare, A. Graves, M. Riedmiller, A. Fidjeland, G. Ostrovski, S. Petersen, C. Beattie, A. Sadik, I. Antonoglou, H. King, D. Kumaran, D. Wierstra, S. Legg, and D. Hassabis, Human-Level Control Through Deep Reinforcement Learning, 518.7540: 529-533, 2015. 
[4] 중앙일보, “소프트뱅크 인공지능 로봇 페퍼, 발매 1분 만에 매진”, 2015. 2. http://article.joins.com/news/article/article.asp?total_id=17247869&ctg=1601 
[5] 머니투데이, 구글 무인자동차 48만km 주행 ‘지구 12바퀴 돌았다’, 2012. 8 . 9 http://www.mt.co.kr/view/mtview.php?type=1&no=2012080917004926536&outlink=1 
[6] DARPA Robotics Challenge Finals 2015, http://www.theroboticschallenge.org/ 
[7] 슬로우뉴스, “로봇, 인공지능, 그리고 노동의 미래”, http://slownews.kr/42964

* T-Robotics의 글은 facebook과 rss reader로도 받아보실 수 있습니다.
[facebook] http://facebook.com/trobotics
[rss] http://t-robotics.blogspot.kr/feeds/posts/default