전체메뉴

검색
팝업창 닫기
이메일보내기

[단독] AI 오류 없애는 DB 설계, 통계청서 세계 최초 성공

표·숫자 맥락 이해시켜 오류 원천 차단

연내 메타데이터 DB 설계도 초안 공개

내년 테스트…2027년 표준화 작업 추진

안형준 통계청장이 지난달 28일 웨스틴조선 서울에서 열린 ‘제14회 국가통계발전포럼’에서 개회사를 하고 있다. 사진 제공=통계청.




통계청이 인공지능(AI)의 고질적인 약점으로 꼽히는 ‘통계 산출 오류’를 해결할 수 있는 ‘메타데이터 데이터베이스(DB)’ 설계에 성공했다. 통계청이 AI 선도기관으로서 국제표준을 선도할 토대를 마련했다는 평가가 나온다.

통계청은 연내 메타데이터 DB 설계도 초안을 공개할 예정이라고 15일 밝혔다. 그동안 챗GPT 같은 대규모언어모델(LLM)은 통계표나 도표를 단순한 텍스트 뭉치로 인식해 통계 산출에 큰 오류가 있었다. 표 안에 실업률·고용률 수치가 어떤 산식과 정의를 거쳐 계산된 것인지, 적용 연령이나 지역이 어디인지 같은 맥락을 전혀 이해하지 못한 것이다. 이 때문에 ‘최근 10년 한국의 실업률 최고치는 월별 기준으로 언제인가’와 같은 간단한 질문에도 엉뚱한 답을 내놓거나 아예 응답을 포기하는 사례가 잦았다. 통계청 관계자는 “AI가 표를 제대로 읽지 못하면 국가정책 의사 결정이나 민간 연구에서 심각한 오류가 발생할 수 있다”고 말했다.



이 같은 AI의 통계 산출 오류를 없애고 도표로 정확한 데이터를 산출하는 능력을 키우기 위해 통계청은 1년간 실무 작업에 착수했고 결국 설계에 성공했다. 통계청이 설계한 메타데이터 DB는 ‘온톨리지 스키마’ 방식이 핵심이다. 온톨리지는 데이터 속 개념과 관계를 지식 그래프 형태로 구조화하는 기술이다. 단순히 숫자 배열이 아니라 ‘정의, 단위, 적용 대상, 출처, 개정 이력’ 같은 의미 태그를 표에 입히는 것이다. 예컨대 실업률 지표라면 △산식(실업자÷경제활동인구×100) △단위(%) △적용 연령·지역 △출처 △개정 이력 등이 함께 기록된다. 이렇게 되면 AI는 숫자 하나를 맥락이 담긴 데이터로 인식할 수 있고 질문자가 시계열 분석을 요구할 때도 오류 없이 정확한 그래프를 제시할 수 있게 된다. 메타데이터 DB가 통계청의 설계대로 온전히 구축된다면 사용자가 오픈AI에서 ‘최근 10년치 고용률 수치를 도표로 그려달라’는 주문을 하면 오류 없이 작업을 수행할 수 있게 된다.

통계청은 12월 안으로 메타데이터 DB 설계도 초안을 공개하고 내년 시범 테스트를 거쳐 2027년부터 표준화 작업을 추진할 방침이다.

[단독] 통계청, 'AI 오류' 없애는 DB 설계 세계 첫 성공
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >
주소 : 서울특별시 종로구 율곡로 6 트윈트리타워 B동 14~16층 대표전화 : 02) 724-8600
상호 : 서울경제신문사업자번호 : 208-81-10310대표자 : 손동영등록번호 : 서울 가 00224등록일자 : 1988.05.13
인터넷신문 등록번호 : 서울 아04065 등록일자 : 2016.04.26발행일자 : 2016.04.01발행 ·편집인 : 손동영청소년보호책임자 : 신한수
서울경제의 모든 콘텐트는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
Copyright ⓒ Sedaily, All right reserved

서울경제를 팔로우하세요!

서울경제신문

텔레그램 뉴스채널