2016년 1월 12일 화요일

인공지능의 과거와 현재, 그리고 미래 (상)


2015년, 인공지능 전쟁의 서막

세계 최고의 기술 산업들이 탄생한다는 미국 캘리포니아의 실리콘밸리. 인텔, HP 등 전세계를 호령하는 IT기업이 탄생했던 미래 기술의 진원지 실리콘밸리는 스타트업(Start-Up) 열풍으로 그 어느 때보다 뜨거운 한 해를 보냈다. 집의 빈 방을 여행객에게 공유하는 서비스인 에어비앤비의 시가총액은 약 32조원으로 거대 호텔체인 힐튼월드와이드의 26조원을 넘어선지 오래이고, 모바일로 택시를 부르는 서비스 우버 역시 시가총액 약 80조로 현대자동차의 시가총액 33조를 두 배 이상 뛰어넘었다. 신기술로 끊임없이 세상에 파괴적 혁신(disrupt)을 가져오는 실리콘밸리, 지금 이곳의 IT기업들이 가장 주목하고 있는 기술은 무엇일까?

그것은 바로 공상과학 영화에선 늘 들어왔지만 아직까지 실현되지 않았던 미래기술, 바로 “인공지능(Artificial Intelligence, AI)”이다. 구글은 인공지능을 이용해 사람없이 스스로 운전할 수 있는 차량인 자율주행차량(Self-driving Car)을 개발해 현재 실전 투입을 눈 앞에 두고있다. IBM이 개발한 슈퍼컴퓨터 왓슨(Watson)은 2011년 미국의 유명 퀴즈프로그램 죠파디(Jeopardy)에서 문제를 음성으로 듣고 부저를 눌러 푸는 동등한 환경에서 기존 퀴즈의 달인들을 제치고 우승한 바 있으며, 체스, 장기 등에 이어 경우의 수가 많아 정복이 어렵다던 바둑마저 인공지능에 의해 정복당할 기세이다. 비록 얕은 속임수를 쓰기도 한 것으로 알려져 있긴 하지만 2014년 인공지능이 튜링테스트를 통과했다는 소식은 우리에게 인간의 지능에 가까운 인공지능의 출현에 대한 경각심을 안겨다주기도 하였다.

유명 퀴즈쇼 죠파디에서 우승을 거머쥔 슈퍼컴퓨터 왓슨의 모습 (사진출처)
사실 인공지능이 우리의 삶에서 아주 동떨어진 기술은 아니다. 우리가 매일 사용하는 스마트폰에도 인공지능 기술이 들어있다. 대표적인 것이 바로 카메라의 초점을 자동으로 잡아주는 “얼굴인식” 기능과 애플 시리(Siri)와 같은 “음성인식” 기능이다. 이들은 인간의 인위적인 개입없이 인간이 의도하는 바를 “알아서” 처리해주는데, 이러한 기능을 하는 모든 에이전트들을 우리는 인공지능이라 부를 수 있다. 인터넷 검색을 할 때 자동으로 추천 검색어를 띄워주는 것도, 유투브에서 외국 영상을 보면 자동 자막을 생성할 수 있는 것도 모두 인공지능이 우리에게 주는 혜택들이다. 이렇듯 이제 많은 미래상품들의 경쟁력은 인공지능 기능에 따라 그 성패가 갈릴 것으로 보이며, 이것이 바로 실리콘밸리 기업들이 인공지능을 다음 파괴적 혁신(disrupt)을 가져올 주역으로 보는 이유 중 하나이다. 

현재에도 조금씩 인공지능에 파괴적 혁신이 이루어지는 분야들을 볼 수 있다. 대표적인 예로는 의료분야와 금융분야를 들 수 있다. 인공지능이 잘 적용되려면 (i) 빅데이터를 쉽게 수집할 수 있어야 하고, (ii) 그것이 정형화된(일정한 틀을 따르는) 데이터이면 더욱 유리하며, (iii) 애매한 상황보다는 숫자로 읽힐 수 있고 숫자로 기여 가능한 환경이면 더더욱 인공지능의 적용이 용이해진다. 그런 측면에서 볼 때 의료분야와 금융분야는 인공지능이 접근하기 비교적 용이한 산업으로 분류된다. 의료분야에서는 X-레이 / CT / MRI 등 메디컬이미지를 인공지능을 이용해 자동분석하는 분야가 급부상하고 있으며, 미래엔 간단한 진료 역시 방대한 의학데이터를 기반으로 한 인공지능이 해결해줄 수 있을 것이란 전망이다. 금융분야에서는 사람이 주식변동 그래프를 보고 투자를 판단하는 것이 아니라 인공지능이 다양한 자료들을 직접 숫자로 받아들여 투자를 판단하는 알고리즘이 각광을 받고 있으며, 보험업계 역시 보험료 계산을 데이터에 따른 위험률에 기반하여 인공지능이 판단하도록 하고 있다. 이 두 산업에 대한 인공지능의 잠식은 단지 인공지능 미래사회의 예고편에 불과하다. 앞으로 많은 영역들이 인공지능의 자동알고리즘에 의해 대체될 것으로 보이며, 이에 따른 직업군의 변화 역시 매우 클 것임에 틀림없다.

BBC가 발표한 사라질 위험이 있는 직업군 순위 (표 출처: BBC / 블로터)
미래 기술사회에서 인공지능의 역할은 아무리 그 중요성을 강조해도 지나침이 없는 것 같다. 하지만 이 기술을 올바르게 이해하고 더 발전시키기 위해서는 인공지능을 단지 SF영화의 이야기거리로 말하는 것에서 벗어나 좀더 현실적으로 다룰 필요가 있다. 인공지능은 과연 어떠한 과정을 통해 발전되어 왔을까? 최근 들어 왜 갑자기 인공지능 기술이 주목받는 것일까? 많은 사람들에게 회자되는 기계학습과 딥러닝이랑 과연 어떤 기술일까? 지금부터 이 질문들에 대해 한번 답해보도록 하자. 

20세기의 인공지능 : 탐색과 추론

인공지능에 대한 이야기를 할 때 꼭 나오는 이야기 중 하나가 바로 강한 인공지능과 약한 인공지능에 대한 이야기이다. 강한 인공지능은 인간과 같이 감정을 갖고 사리판단을 할 수 있는 인간과 비슷한 객체로서의 인공지능을 이야기하고, 약한 인공지능은 특정 기능만을 대체하는 부분적 인공지능을 일컫는데, 이는 매우 오래된 담론으로 현대에 있어서는 그리 중요한 이야기는 아닌 것 같다. 왜냐하면 현대에는 그것에 대한 특별한 구분없이 핸드폰과 같은 기기에 탑재되는 약한 인공지능에 대한 연구부터 시작하여 종합적 사고판단을 할 수 있는 강한 인공지능을 목표로 활발한 연구가 이루어지고 있기 때문이다. 참고로 많은 이들이 인공지능의 잠재적 해악을 이야기할 때 ‘인공지능이 인간을 해치면 어떻게 하는가?’와 같은 질문을 던지는데, 강한 인공지능에 도달하기까지의 기술개발의 길이 아직 매우 멀기에 그것에 대한 두려움을 갖기엔 아직은 약간 이른 담론이 아닌가 싶은 생각이 든다. 

지금부턴 인공지능의 순차적 발전 과정을 살펴보고자 한다. 그것을 이해한다면 아마도 지금의 인공지능 붐과 미래의 인공지능에 대해 연속성 있게 예측할 수 있는 눈을 갖추게 될 것이다. 초기의 인공지능은 트리 탐색(tree search) 문제풀이에 가까웠다. 대표적인 인공지능 문제 중 하나인 하노이의 탑을 한번 생각해보도록 하자. 이 문제의 규칙은 간단하다: (i) 원판은 한번에 하나씩만 옮길 수 있으며, (ii) 큰 판은 작은 판 위로 올라갈 수 없다. 이 두가지 규칙을 지키며 한 쪽에 있는 원판들을 모두 다른 한쪽으로 옮기는 것이 하노이의 탑 문제의 목표이다. 이 문제는 매우 간단해 보이지만 직접 해본다면 그리 간단하게 풀리는 문제는 아니란 점을 깨닫게 될 것이다. 

인공지능의 고전 문제 중 하나인 '하노이의 탑' 문제. 이 문제는 탑의 현재 상태와 이 상태에서 취할 수 있는 행동들을 기반으로 트리를 만들어 그 트리의 탐색 문제로 대치하여 해결할 수 있다. (사진출처)
고전의 인공지능은 이 문제를 트리 탐색 문제로 대치하여 해결한다. 예를 들어 초기상태에서 내가 할 수 있는 행동(action)은 맨 위에 있는 원판을 두번째 또는 세번째 칸으로 옮기는 것이다. 이것은 첫 노드에서 다른 두 노드로 가지를 뻗어나가는 것으로 생각할 수 있다. 마찬가지로 그 이후의 노드들 역시 각각의 상태(state)에서 취할 수 있는 행동과 이후 얻어지는 결과 상태의 가지들로 표현할 수 있을 것이고, 이를 반복하면 모든 경우의 수에 방대한 트리를 얻을 수 있을 것이다. 남은 일은 어떠한 경로를 따라가야 원하는 정답 상태까지 도달할 수 있을지 트리를 탐색하는 일이다. 

고전의 인공지능 문제는 이러한 거대한 트리 속에서 어떻게 하면 빠르게, 그리고 정확히 해답을 찾을 수 있을까에 대한 문제였다. 다시 말해 현실에 해결해야 할 문제가 있다면 그것을 내가 취할 수 있는 행동과 결과 상태들에 대한 경우의 수로 나열하여 방대한 트리를 만들고, 그 트리를 탐색함으로써 문제에 대한 해결책을 얻는 것이다. 모든 노드를 모두 탐색(방문)한다는 것은 모든 경우의 수를 다 따져보는 것과 동일한 뜻인데, ‘어떤 순서로 노드들을 탐색하느냐’가 인공지능의 성능을 크게 좌우한다. 대표적인 트리 탐색방법으로는 한가지 줄기 씩 모두 탐색하는 깊이우선탐색(depth-first search, DFS)과 같은 높이의 노드들을 모두 방문하며 내려가는 너비우선탐색(breath-first search, BFS)이 있다. 미로 찾기나 체스 등 간단한 인공지능 문제들은 이렇게 트리탐색 문제로 대치하여 문제를 해결할 수 있다. 

고전의 인공지능 문제는 선택의 경우의 수에 따른 트리탐색으로 대치할 수 있다. 위의 그림은 세번의 양자택일(binary) 선택에 따른 경우의 수 트리를 보여주는데, 각 단계별 선택 가능한 경우의 수를 모두 따져보는 너비우선탐색(BFS)과 한가지 길 씩 체크해보는 깊이우선탐색(DFS)을 보여주고 있다. (그림에서 숫자는 노드를 방문하는 순서를 나타낸다.)
하지만 이러한 접근 방법에는 문제가 존재한다. 우리가 현실에서 맞이하는 문제들은 하노이의 탑이나 체스처럼 명확하게 정의가 되지 않는 경우가 대부분이기 때문이다. 예를 들어 사진에서 얼굴을 인식하는 문제를 예로 들어보자. 이미지에는 어떠한 상태들을 정의할 수 있을까? 100X100 사이즈의 흑백사진만해도 각 픽셀이 0(흑) 또는 1(백)을 가리킨다고 하면 총 210000의 셀 수 없을 정도로 많은 상태가 존재하게 될 것이다. 이들 하나하나의 경우의 수에 대해 의미를 부여하는 것이 과연 현명한 방법일까? 결과적으로 트리탐색의 인공지능은 문제를 시스템적으로 해결하고자하는 최초의 시도로서 의미가 있었지만 그것들은 간단한 게임과 같은 정형화된 상황에만 적용가능한 인공지능이었을 뿐, 인간이 마주하는 현실을 잘 해결할 수 있는 접근 방법은 아니었던 것이다.

모든 경우의 수를 따져 문제를 해결하고자 하는 트리탐색 기반의 인공지능과 달리, 많은 양의 지식을 에이전트에 주입시킴으로써 인공지능이 지식을 기반으로 판단하게끔 하는 지식추론 기반의 전문가 시스템(expert system)도 고전 인공지능의 한 축을 이루었었다. 예를 들면 이 세상의 모든 의학지식을 에이전트에 주입하여 의사의 역할을 할 수 있는 인공지능을 꿈꾸거나 또는 법률에 대한 모든 지식을 주입하여 법률가의 역할을 할 수 있는 인공지능을 꿈꾸었던 것이다. 연구자들은 세상에 있는 모든 지식을 모두 에이전트에 탑재해 그 지식을 기반으로 옳은 판단을 내리는 인공지능을 개발하려 시도하였으며, 만약 세상의 모든 지식을 에이전트에 담을 수 있다면, 그 에이전트는 인간보다 뛰어난 판단력을 가질 수 있을 것이라 기대했었다.

하지만 이 역시도 결국 미완의 시도로 끝이 났다. 실패의 가장 큰 이유는 세상에 존재하는 대부분의 판단은 매우 “애매한” 조건들 속에서 이루어지는 “종합적” 판단이라는 것이다. 예를 들어 우리는 친구가 문을 열고 들어와 축 처진 어깨로 슬픈 눈빛을 하며 “안녕”이라고 말하는 것만으로도 “너 오늘 무슨 일 있어?”라며 그 상황을 이해하고 대응할 수 있다. 하지만 인공지능을 위해 이러한 애매한 조건들 속의 지식을 일일이 코딩하는 것은 거의 불가능에 가까우며 (예를 들어 ‘슬픈 눈빛이란 평소의 눈 크기보다 30%가량 작은 눈 크기로 10도 이상 쳐진 눈꼬리를 가졌을 때를 말한다.’라고 정의하는 것 자체가 불완전하고 거의 불가능에 가까운 작업들이다.) 따라서 세상의 모든 상황을 알려줄 순 없다는 점, 그리고 사람은 모순되는 상황들 속에서 종합적인 판단을 한다는 점에서 전문가 시스템 기반의 인공지능은 한계점을 이내 곧 맞이하게 된다.

위의 사진은 비록 다양한 각도에서 찍힌 한 사람의 모습이지만 인간은 이것을 보고 같은 인물임을 금새 알 수 있다. 하지만 인공지능은 어떨까? 만약 우리가 물체(얼굴)가 보여질 수 있는 모든 가능성들을 빠짐없이 코딩해야하는 것이 가능할까? 그러한 방식으로 과연 완벽한 인공지능을 만들 수 있을까? 아마 쉽지 않을 것이다. 이러한 점에서 전문가시스템 기반의 인공지능은 금새 한계점을 나타내었다. (사진출처)
이러한 한계들 속에서 새로운 인공지능의 패러다임으로 떠오른 것이 바로 기계학습(Machine Learning)이다. 기계학습은 기존의 논리, 추론 위주의 인공지능과는 달리 경험을 통해 쌓인 데이터로부터 귀납적으로 판단을 내린다. 이는 어쩌면 인간의 학습방법과도 매우 유사하다고 볼 수 있는데, 우리가 꼭 어떠한 룰에 따라 판단하는 것이 많은 경험의 “패턴”을 통해 별 고민없이 판단을 내릴 수 있듯, 인공지능도 데이터를 기반으로 그러한 시도를 해보자는 것이 바로 기계학습의 시작이었다. 스스로 학습하는 인공지능인 기계학습, 기계학습은 21세의 새로운 핫 키워드로 떠오른다.

* 이 글은 "인공지능의 과거와 현재, 그리고 미래 (하)"로 이어집니다.


* 이 글은 동아엠엔비에서 곧 발간될 "과학이슈 11 시즌4"에 수록될 글의 초고입니다.

[facebook] http://facebook.com/trobotics