전체메뉴

검색
팝업창 닫기
이메일보내기

KISTI, 기계학습 데이터 활용서비스 '스타트'

사이언스온서 425만건 개방

김재수 KISTI 원장.




한국과학기술정보연구원(KISTI)이 ‘과학기술 분야 기계학습 데이터 구축 사업’의 결과물을 누구나 쉽게 활용할 수 있도록 과학기술 지식 인프라 사이언스온(ScienceON)에서 ‘기계학습 데이터 활용 서비스’를 시작했다고 3일 밝혔다.

이를 위해 KISTI는 과학기술 분야 국내 논문과 국가 연구개발(R&D) 연구 보고서를 토대로 인공지능(AI)을 위한 데이터셋 5종 425만 건을 구축했다. 이를 통해 기계학습 데이터 4종(논문 전문 텍스트, 보고서 표·그림, 논문 QA, 논문 문장 의미태깅)을 접목한 서비스를 선보였다.



구체적으로 검색 키워드가 본문 문장에서 어떻게 표현되는지 키워드의 전후 내용을 스니펫(검색한 의도에 부합하는 답을 제공할 수 있는 최소한의 단위)으로 제공한다. 보고서에 수록된 표·그림 이미지, 캡션, 인용 문장까지도 함께 제공한다. 논문 QA 데이터를 활용해 논문의 핵심 어휘를 질문과 답변 형식으로 쉽게 풀이해 제공한다. 연구 목적, 방법, 결과를 요약해 제공한다. 이 밖에 요약 정보를 PDF 원문에 표시해 제공한다. 특정 참고문헌이 인용된 문장도 논문에서 바로 확인할 수 있다.

김재수 KISTI 원장은 “현재 많은 연구 분야에서 AI를 활용하고 있으나 AI가 활용할 수 있는 데이터, 즉 기계학습 데이터는 부족한 실정”이라며 “사이언스온에 다양한 기계학습 데이터를 서비스함으로써 연구계에 큰 도움이 될 것”이라며 “혁신적 연구 활동 지원과 새로운 비즈니스 창출에 기여할 것”이라고 말했다.
< 저작권자 ⓒ 서울경제, 무단 전재 및 재배포 금지 >
주소 : 서울특별시 종로구 율곡로 6 트윈트리타워 B동 14~16층 대표전화 : 02) 724-8600
상호 : 서울경제신문사업자번호 : 208-81-10310대표자 : 손동영등록번호 : 서울 가 00224등록일자 : 1988.05.13
인터넷신문 등록번호 : 서울 아04065 등록일자 : 2016.04.26발행일자 : 2016.04.01발행 ·편집인 : 손동영청소년보호책임자 : 신한수
서울경제의 모든 콘텐트는 저작권법의 보호를 받는 바, 무단 전재·복사·배포 등은 법적 제재를 받을 수 있습니다.
Copyright ⓒ Sedaily, All right reserved

서울경제를 팔로우하세요!

서울경제신문

텔레그램 뉴스채널

서울경제 1q60