□ 과학기술정보통신부(장관 최기영, 이하 ‘과기정통부’)는 디지털 뉴딜 「디지털 댐」의 기초이자 핵심인 인공지능(AI) 학습용 데이터 구축사업의 성공적 추진을 위한 핵심관건인 데이터 품질관리 체계를 글로벌 수준으로 대폭 강화한다고 밝혔다.
ㅇ 인공지능(AI) 서비스 개발에 필수적인 인공지능(AI) 학습용 데이터를 대규모로 구축·개방하는 이번 사업은 추경(2,925억원)으로 10대 분야 150종의 데이터를 구축할 계획이며, 지난 8월말 수행기업·기관(총 584개) 선정을 완료하였다.
□ 과기정통부는 활용도 높은 양질의 데이터를 구축하기 위해 품질관리 전담기관(한국정보통신기술협회)을 운영하고 있으며, 자연어·자율주행차 등 분야별로 전문적인 품질검증 지원체계를 마련하기 위해 이번에 전문가들이 참여하는 ‘품질 자문위’를 구성하고 첫 킥오프 회의를 9월 22일 10시 한국정보화진흥원 서울사무소(광화문)에서 개최했다.
ㅇ 자문위는 8개 분과*로 운영되며, 분과별로 산·학·연 전문가, 데이터를 활용할 활용기업 등 10명 내외, 전체적으로 총 80여명이 참여한다.
* 자연어처리, 헬스케어, 자율주행, 농축수산, 국토환경, 미디어, 안전, 기타 등 8개 분과
ㅇ 자문위는 △데이터 구축계획 타당성, △구축단계별 품질절차 준수, △원시 데이터 및 라벨링 데이터의 품질·활용도 검증 등에 대한 전문적인 자문 역할을 담당할 예정이다.
□ 이날 회의는 위원장으로 선임된 인공지능 분야에 명망이 높은 서울대학교 전기정보공학부 이경무 교수와 분야별 위원장 등이 참석하여 품질관리를 강화하기 위한 다양한 방안을 논의하였다.
□ 한편, 과기정통부는 데이터 품질관리 강화를 위해 △세계 수준의 품질검증 및 유지보수 체계 확립, △사업 수행기관의 품질 역량 및 책임성 대폭 강화를 기본방향으로 ‘품질 자문위 운영’을 포함한 세부적인 방안을 마련하였다.
ㅇ 먼저, 기 개발된 ‘인공지능 학습용 데이터 구축 및 품질관리 공통기준(’19년)‘을 해외사례 분석, 인공지능 및 품질관리 전문가 자문 등을 거쳐 보완·구체화하여 데이터의 다양성, 정확성, 유효성 등을 종합적으로 평가할 수 있는 품질기준 및 검증방법을 확립하였다.(붙임 3)
ㅇ 아울러 대량의 데이터를 전과정 대부분 수작업으로 구축하여 구축단계에서 완벽한 품질검증이 어려운 구조적 한계를 고려하여, 사후 활용단계에서의 지속적인 유지보수 체계를 마련하기 위해 무상 유지보수기간(1년간)을 설정하고, 기 구축된 데이터(’17~‘19년)에 대해서도 조사를 거쳐 필요시 내년에 유지보수 및 업데이트할 계획이다.
ㅇ 또한, 수행기관의 책임감을 제고하기 위해 △데이터별 구축기업 실명제(과제책임자 포함) 도입, △품질평가 결과 공개 및 내년 사업선정 시 반영(가점·감점), △하자 보증금 납부 등의 방안도 마련하였다.
□ 강도현 인공지능기반정책관은 “’품질 자문위‘에 참여하는 각 분야 전문가들의 지혜를 모아서 ’디지털 댐‘의 핵심인 활용도 높은 양질의 인공지능 학습용 데이터 구축에 최선을 다하겠다”고 밝혔다.