전체메뉴

검색
팝업창 닫기
이메일보내기

[Science&Market] 선거, 메르스, 그리고 빅데이터

선거예측서 재난대응까지

빅데이터 활용도 높아지는데 우린 단순 자료분석에 치우쳐

데이터 과학·공학자 양성 시급


[Science & Market] 선거, 메르스, 그리고 빅데이터

문명운 본지 객원기자·KIST 계산과학연구센터장

내년 대선이 있는 미국이나 총선을 준비하고 있는 우리나라나 모두 요즈음 선거 관련 이슈가 많다. 특히 최근 들어 소셜미디어나 빅데이터 등을 활용한 디지털 선거 방식이 중요해지고 있다. 빅 데이터란 뉴스나 소셜미디어 등 디지털 환경에서 생성되는 수치나 그림, 영상 등의 방대한 데이터이다. 지난 2012년 미국 대선에서 오바마 선거팀이 효과적으로 활용한 선거 기술로 유명하다. 기본적인 유권자 정보 외에 지역, 이슈, 각종 소셜네트워크서비스(SNS) 등에 올린 글을 수치화해 빅데이터로 만든 후 이를 분석해 부동층을 공략하는 맞춤형 선거 전략을 펼쳤다고 한다.

빅데이터는 정치뿐 아니라 우리 생활, 경제, 의료, 안전 등 각 분야에서 점차 활용도가 증가하고 있다. 일상생활에서 빅데이터로 쓰일 수 있는 데이터의 종류도 민원, 교통, 인구, 오염도 측정, CCTV, 소셜미디어 등 다양하다. 특히 교통 분야에서 택시나 버스 노선 변경이나 공공재 측면의 무선 인터넷 최적 장소 도출에 적극적으로 활용되고 있다. 이런 연구들이 쌓이면 감염병과 같은 범국가적 재난이 경제 전반에 미치는 영향을 파악하고, 나아가 이를 효과적으로 예방하는 데 도움이 될 수 있을 것이다.

빅데이터의 활용은 경제적 가치도 창출한다. 미래창조과학부 산하 빅데이터 센터는 시장조사기관인 IDC(인터넷 데이터 센터)의 예측을 인용해 올해 세계 빅데이터 시장을 약 169억 달러로 예상했다. IDC의 2014년 보고서는 인프라, 소프트웨어, 서비스 등 3개 분야로 시장을 나누어 각각의 비용과 효과를 분석했는데, 2017년에는 3개 분야 총 금액이 약 324억 달러가 될 것으로 전망했다. 빅데이터 산업에 대한 투자도 지난해보다 30%나 성장하여 140억 달러로 예측됐다. 빅데이터를 통한 매출 증대 효과를 직접 파악하기는 어려우나 투자를 통해 기업 경영이 개선됨은 분명하다.



빅데이터는 국내외에서 활발히 활용된다. 현대백화점은 빅데이터 분석을 통해 눈이 오면 식품 판매가 늘어나고 덩달아 아동용품 소비도 늘어난다는 추세를 발견한 뒤 해당 상품을 한 자리에 배치하는 맞춤형 마케팅 전략을 도입, 매출을 늘렸다. 올빼미버스로 불리는 서울시의 심야버스도 KT의 통화량 통계 데이터와 서울시가 보유한 교통 데이터를 융합·분석해 노선을 9개로 확대했다. 경기도의 경기연구원에서는 이를 빅데이터를 범죄 관련 정보에 활용할 계획을 수립한다. 아마존은 고객상품 추천을 위한 특별한 빅데이터 기반 알고리즘을 보유하고 있고, 이베이는 고객의 소셜미디어 활동 내역과 과거 구매 이력을 분석해 적합한 선물을 추천한다.

올여름 내내 우리 사회는 중동호흡기증후군, 메르스(MERS)로 고생했는데 이러한 감염병 대처에도 의료 데이터 분석은 점차 중요해지고 있다. 2009년의 신종플루나 그 이전 홍콩의 조류 독감 때만 해도 감염병의 전파경로나 전파 상황은 예측이 어려워 효과적인 백신 전략을 세울 수 없었다. 그러나 이후 데이터 과학이 성장하면서 감염 경로 등을 예측할 수 있는 사회실험도구인 컴퓨터 시뮬레이션을 본격적으로 활용할 수 있게 됐다.

필자가 속한 한국과학기술연구원(KIST) 계산과학연구센터도 신종 인플루엔자(H1N1) 감염자가 공항을 통해 입국했을 때 바이러스가 어떻게 퍼질 수 있는지를 계산과학적 접근을 통해 분석하고 있다. 감염병의 전파경로를 컴퓨터 시뮬레이션하기 위해서 빅데이터를 이용하고 있는 것이다. 교통수단이나 지역 커뮤니티 등에 대한 빅데이터가 필요했던 신종플루와 달리, 메르스는 병원 응급실 환자나 의사의 이동경로 등 기존에 전혀 사용하지 않았던 빅데이터가 요구된다.

사회현상이나 질병전파를 해석하기 위해서는 빅데이터를 이용해 컴퓨터 시뮬레이션을 할 때 주어진 자료 전체를 분석해 그 안에 숨겨진 의미를 찾아내야 한다. 하지만 우리나라의 빅데이터 분석은 간단한 자료 분석 수준에 치우치는 경향이 있다. 빅데이터 분석을 위한 자료 분석가만 채용하는 수준이어서 재난 상황이 발생했을 때 방대한 빅데이터로 대처할 수 있는 능력이 부족하다. 감염병 시뮬레이션 연구 결과 검증을 위한 후속 연구가 이어져야 하는데 연구 결과를 활용할 방안이 다양하지 않다. 실시간으로 쌓이는 데이터는 방대한데 이를 분석하고 활용할 수 있는 데이터 과학자나 공학자가 없다. 이 분야에 대한 전문 인력 양성이 매우 필요하다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >
주소 : 서울특별시 종로구 율곡로 6 트윈트리타워 B동 14~16층 대표전화 : 02) 724-8600
상호 : 서울경제신문사업자번호 : 208-81-10310대표자 : 손동영등록번호 : 서울 가 00224등록일자 : 1988.05.13
인터넷신문 등록번호 : 서울 아04065 등록일자 : 2016.04.26발행일자 : 2016.04.01발행 ·편집인 : 손동영청소년보호책임자 : 신한수
서울경제의 모든 콘텐트는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
Copyright ⓒ Sedaily, All right reserved

서울경제를 팔로우하세요!

서울경제신문

텔레그램 뉴스채널

서울경제 1q60