전체메뉴

검색
팝업창 닫기
이메일보내기

[책꽂이]불확실성의 시대…데이터가 만능키는 아냐

■데이터과학자의 사고법-김용대 지음, 김영사 펴냄





18세기 영국에서 산업혁명이 일어난 이후 많은 사람들이 런던 등 대도시로 몰려들었다. 이로 인해 도시 위생 시스템은 바닥을 드러냈고 1832년과 1849년 두 차례 발병한 콜레라로 1만 명 넘는 사람이 목숨을 잃었다. 이후 1854년에 또다시 콜레라가 발생하자 존 스노 박사는 오물에 오염된 템즈 강이 병의 원인일 수 있다고 보고 근거 확보에 나섰다.환자가 발생한 집을 일일이 방문해 지도에 표시한 끝에 스노 박사는 템즈 강과 연결된 물 펌프 사용 지역에 콜레라 환자가 집중돼 있다는 사실을 밝혀 냈다. 이 연구 성과는 의회에 보고됐고, 질병의 추가 확산을 막는데 결정적 역할을 했다. 발로 뛰어 수집한 데이터가 질병과 환경의 연결성을 입증한 것이다.

그런가 하면 2008년 발생한 금융 위기는 일종의 데이터 과잉이 낳은 참사였다. 금융 시장에 위험 신호가 될 수 있는 데이터는 충분히 있었지만 금융 회사들은 이를 눈여겨보지 않았다. 데이터 수집과 분석에 신경을 썼다면 전 세계 경제를 뒤흔든 금융 위기를 피하거나, 적어도 피해 규모를 줄일 수 있었음에도 탐욕에 눈 먼 인간들은 그 기회를 놓쳤다.

데이터 과학은 4차 산업혁명에 대한 관심이 고조된 이후에 등장한 분야처럼 인식 되곤 하지만 실은 오래 전부터 여러 모습으로 우리 삶 속에 존재했다. 날씨 예보는 물론 세수나 인구 예측, 역학 조사 등 다양한 분야에서 활용돼 왔다. 그럼에도 최근 들어 데이터 과학이 더 주목 받는 이유는 불확실성이 점점 커지고 있기 때문이다.



김용대 서울대 통계학과 교수의 신간 ‘데이터과학자의 사고법’은 우리의 일상 속 깊숙이 파고든 데이터 과학을 대중의 눈높이에 맞춰 쉽게 설명하는 책이다. 책은 전문적인 데이터 과학 방법론 등을 다루지 않는다. 일상 속 데이터과학의 사례를 소개하고 데이터과학에 대한 지식 결여나 맹신이 어떤 위험을 초래 할 수 있는 지를 알려준다.

그러면서도 김 교수는 데이터과학이 만능 열쇠가 아니라고 강조한다. 데이터과학은 데이터를 기반으로 합리적 사고를 하는 방법에 대한 과학이다. 다시 말해 옳은 의사 결정을 해주는 학문이 아니라 합리적 의사 결정에 관한 학문이라 할 수 있다. 책에 따르면 옳은 의사 결정을 알려주는 학문이나 기술은 단연코 없다. 만약 그런 게 존재한다면 모두가 주식 시장의 승자가 되고, 코로나 19 같은 감염병도 예측 가능한 범위 안에 있어야 한다. 그럼에도 데이터과학에 기반한 합리적 의사 결정은 확률적으로 옳은 결정일 가능성이 높기 때문에 관심을 가져야 한다고 책은 말한다. 불확실하고 불완전한 사회에서 우리를 더 나은 선택으로 인도해 주는 것, 그것이 데이터과학의 역할이라는 것이다. 1만6,800원.

/정영현 기자 yhchung@sedaily.com
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >
주소 : 서울특별시 종로구 율곡로 6 트윈트리타워 B동 14~16층 대표전화 : 02) 724-8600
상호 : 서울경제신문사업자번호 : 208-81-10310대표자 : 손동영등록번호 : 서울 가 00224등록일자 : 1988.05.13
인터넷신문 등록번호 : 서울 아04065 등록일자 : 2016.04.26발행일자 : 2016.04.01발행 ·편집인 : 손동영청소년보호책임자 : 신한수
서울경제의 모든 콘텐트는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
Copyright ⓒ Sedaily, All right reserved

서울경제를 팔로우하세요!

서울경제신문

텔레그램 뉴스채널

서울경제 1q60