FORTUNE FOCUS | 초보 단계를 넘어선 왓슨

이 기사는 포춘코리아 2017년 1월호에 실린 기사입니다.

퀴즈쇼 <제퍼디 Jeopardy>에서 승리한 후 5년 동안, IBM의 인지 컴퓨팅 시스템은 여러 게임을 벌여왔다. 이 슈퍼 컴퓨터는 이제 최소한 20개 이상의 산업분야에서 수천 개 기업의 ‘청부업자’ 역할을 하고 있다. 왓슨의 보스를 만났다.

데이비드 케니는 지난 2월부터 IBM의 왓슨 그룹을 맡아왔다. 그가 CEO로 재직 중이던 웨더 컴퍼니 Weather Co.가 빅블루 Big Blue (*역주: IBM의 별칭) 에 인수되면서부터다. 그 후 몇 달 간 왓슨의 사업은 급성장했다. 현재 전세계 10만 명 이상의 개발자들이 36개 이상의 왓슨 애플리케이션 프로그램 인터페이스(API)를 사용하고 있다. 포춘의 부 편집장 클리프턴 리프 Clifton Leaf 는 지난 10월 중순경 데이비드 케니를 만났다.

IBM 왓슨의 총괄책임자인 그는 AI 시스템의 신 사업기지인 왓슨 웨스트 Watson West의 오픈과 10월 24일 라스베이거스에서 열리는 제 2회 월드 오브 왓슨 콘퍼런스 World of Watson conference를 준비하기 위해 샌프란시스코를 방문 중이었다(이 콘퍼런스는 이제 막 싹을 틔우고 있는 파트너-사용자간 생태계의 회합자리다). 다음 기사는 인터뷰를 일부 발췌한 것이다. 전체 인터뷰는 포춘 홈페이지의 데이비드 케니 섹션에서 확인할 수 있다.

포춘: 요즘 AI 영역에 대한 여러 전문 용어를 들을 수 있다. ‘인공지능’, ‘머신 러닝’, ‘딥 러닝’, ‘자율학습’ 등이 있는데 IBM에서 왓슨을 묘사하는 용어는 ‘인지 컴퓨팅’이다. 차이가 무엇인가?

케니: 딥 러닝은 머신 러닝의 일부로, 더 정확하게는 일련의 알고리듬이다. 딥 러닝은 보다 고차원적인 시스템, 이를 테면 ‘복잡한 회선 신경망(convolutional neural network)’을 사용한다. 기본적으로 단계를 세분화해 심층적으로 볼 수 있다는 뜻이다.

예컨대 머신 러닝은 텍스트를 읽는 데 활용하고 딥 러닝은 엑스레이를 판독할 때 필요하다. 이 모든 것들이 인공지능의 개념 안에 포함된다. 물론 IBM에서는 많은 경우, 인공(artificial) 지능이 아니라 확장(augmented) 지능이라고 지칭한다. 그러니까 이 시스템은 기계 처리와 인간 해석 사이에 있는 것이고, 우리는 기계와 인간 간의 이런 상호작용을 인지시스템이라 부르고 있다. 그런 식으로 계속 쌓여가게 된다.

우리가 자율학습이라 부르는 건 따로 훈련 과정을 지정하지 않고 스스로 학습하기 시작하는 것을 의미한다. 이것이 일부 사람들이 생각하는 진정한 인공지능, 심지어 인공일반지능(artificial general intelligence)에 점차 가까워지는 것이라 할 수 있다. 우리는 그 초기단계에 진입했다. 왓슨은 일부 영역에서 그렇게 하고 있다.

포춘: 성공시키려면 상당한 처리능력이 필요할 것 같다.

케니: 정말 엄청난 수준의 처리능력이 요구된다. 인간의 뇌처럼 왓슨도 24시간 내내 구동상태를 유지하게 해야 하기 때문이다. 이를 가능하게 하는 주요 요소가 클라우드 컴퓨팅이라고 믿는 이유도 바로 이 때문이다. 클라우드 컴퓨팅이 등장한 후엔 다양한 기계에 동시 접근하는 것이 가능해졌다. 그 전에는 본체에 접근하는 게 고작이었다. 물론 IBM은 그 본체 자체를 가장 크게 만들었고, 그 덕분에 왓슨이 5년 전 <제퍼디!>에서 승리할 수 있었다. 하지만 현재 우리가 목격하는 AI의 가속화된 발전은 어느 정도 클라우드 덕분이라 할 수 있다.

포춘: 하지만 단지 클라우드 때문만은 아닌 듯하다. 그렇지 않은가? 왓슨은 사물인터넷(IoT)을 통해 점점 실생활에 ‘접목’되고 있다. 왓슨의 IoT 사업만 봐도 4,000여 고객사와 1,400여 파트너들이 있지 않은가?

케니: 그렇다. 내가 웨더 컴퍼니를 거쳐 IBM에 온 이유도 바로 그것과 관련이 있다. 요즘 일상 생활에서 센서는 보편화 되어 있다. 자동차는 물론 물류시스템을 통해 움직이는 것, 즉 운송되는 박스들에도 센서가 들어가 있다. 공장이나 교통시스템도 마찬가지다.

요즘은 우리가 입거나 차고 다니는 것들에도 대개 센서가 들어가 있다. 이러한 센서들-그리고 모바일 기기들-을 통해 처리된 정보들이 적재적소에서 우리에게 지식과 통찰력을 제공해준다. 게다가 이런 센서들이 블루투스나 다른 통신기기를 통해 클라우드에서 상호작용을 한다. 이 과정에서 연산처리가 일어나고, 우리는 원하는 답을 얻게 된다. 마치 이런 것들이 우리를 위해 사고하는 것 같다. 그러나 사실은 그들의 뇌나 다름없는 가장 가까운 데이터센터에 접근하는 것이다. 그래서 이처럼 동일한 종류의 상호작용이 도처에 있는 애플리케이션 안에 ‘내장(get embedded)’ 되는 것이다.

암 치료를 예로 들어보자. 종양학에 왓슨을 활용하면, 암 전문의는 환자 기록을 실시간으로 받을 수 있다. 그러면 왓슨은 현재 시행 중이거나 시행 예정인 임상시험 중 각 환자에게 가장 잘 맞는 시험을 찾아낸다. [현재까지 왓슨은 약 2,600만 건의 의학 및 과학 논문들을 완전히 습득했다. 또 임상연구 사이트(clinicaltrials.gov)-연방정부의 공공 데이터베이스다-에 등록된 약 3,000건의 임상시험을 집중 학습했다. 왓슨은 언론을 통해 연구실험 기업 퀘스트 다이어그노스틱스 Quest Diagnostics, 메모리얼 슬론 케터링 암센터 Memorial Sloan Kettering Cancer Center, 브로드 인스티튜트 Broad Institute와 협력하고 있다고 발표한 바 있다. 미국 전역의 암 환자와 전문의들이 왓슨의 게놈분석을 활용하기 위해서다.]

포춘: 왓슨이 의학논문처럼 밀도 있는 글을 습득하도록 훈련시킬 수 있었던 노하우은 무엇인가?

케니: 해당 작업이 이뤄진 시기는 내가 IBM으로 옮겨오기 전이었다. 그건 ‘지식 추출’로부터 시작됐다. 문서를 읽고 공통된 구절을 찾아내고 이들 사이에 연관관계를 파악하는 것이다. 동일한 작업을 통해 공통 단락도 찾아냈다.

그 후에 교정작업이 이뤄졌다. 인간의 정정작업이 매우 중요해지는 게 바로 이 지점이다. 시작하자마자 기계가 자율 학습을 하고, 알아서 패턴을 찾아낼 가능성은 희박하다. 말 그대로 왓슨에게 “그래, 이 말은 이런 뜻이야. 그렇지. 그 두 개를 하나로 묶어. 그래 그건 맞았어. 아니야 그건 틀렸어”라고 알려줘야 한다. 그리고 “틀렸다”고 말할 때마다 시스템이 알고리듬을 조정하는 과정을 반복, 최종적으로 올바른 답을 산출해내는 식이다. 시간이 지날수록 더 개선된다

포춘: 인간의 전문 지식에 수 톤에 달하는 데이터를 더해 시스템을 훈련시킨다는 뜻처럼 들린다.

케니: 그렇다. 한 가지 단서를 더 붙이자면 현재는 단 한 종류의 왓슨만이 존재하는 게 아니다. 종양학 전문 왓슨이 있는가 하면 방사선학 전문 왓슨도 있다. 내분비학, 법학, 세금 규정, 소비자 서비스 등 전문 왓슨이 다 따로 있다. 그렇게 해야 각 시스템에 맞는 데이터를 입력해 정확하게 훈련시킬 수 있기 때문이다. 그리고 각 전문가들과 함께 협력하고 있다. 종양학은 메모리얼 슬론 케터링과, 심장학은 미국심장협회(American Heart Association)와 협력하는 식이다.

이런 시스템은 각 전문 영역에 더욱 집중할 수 있기 때문에 수행결과도 좋다. 사람과 다르지 않다. 우리가 보통 기자에게 암 관련 조언을 얻거나, 종양학 전문의에게 부동산 정보를 요청하지 않는 것처럼 말이다. 사람들이 전문 영역을 추구하면서 자신의 분야를 더 잘 알게 되는 것처럼 AI도 마찬가지다.

서울경제 포춘코리아 편집부/By Clifton leaf