□ 과학기술정보통신부(장관 최기영, 이하 ‘과기정통부’)는 6월 22일, 인공지능(AI) 개발에 필수적인 양질의 데이터를 대규모로 구축·개방하는 “AI 학습용 데이터 구축 사업”의 20개 과제를 확정하였다고 밝혔다.
□ 올해는 작년보다 예산 및 과제가 2배 늘어난 20개 과제(10개 지정공모, 10개 자유공모)를390억 원 규모(‘19년 195억 원)로 추진하였으며, 총 92개 사업자가 참여하여 평균 4.6대 1의 경쟁률을 보였다.
□ (국가적·산업적 필요성) ❶사람의 감성과 문맥을 이해할 수 있는 자연어 처리분야, ❷자동차, 드론 등 자율주행기술 분야, ❸음성, 시각, 언어 등 융합 분야 등 국가적으로 산업적으로 활용가치가 높고 데이터 확보 필요성이 시급한 과제를 선정하였다.
□ (국민편의 향상) 이와 함께, ❶질병진단(치매, 구강질병 등), 운동 등 헬스케어 분야, ❷사람의 얼굴을 악의적으로 변조한 딥페이크 방지 기술 분야, ❸장애인의 삶을 향상 시킬 수 있는 분야 등 국민 생활을 윤택하게 하고 사회적 문제를 해결할 수 있는 과제를 선정하였다.
□ AI 학습용 데이터를 수집하고 가공하는데 많은 인력이 필요하다.
ㅇ 이에, 미국, 중국 등 해외에서는 누구나 참여하여 데이터를 가공할 수 있는크라우드소싱 방식*을 경쟁적으로 도입하여 인력 부족 문제를 해결하면서양질의 데이터 확보와 일자리를 창출하고 있다.
*크라우드소싱 : 언제 어디서든 누구나 데이터 수집 및 가공에 참여하는 방식
□ 과기정통부는 작년에2개 과제를 크라우드소싱 방식으로 추진한데 이어, 올해는 모든 과제에 전면적으로 크라우드 소싱 방식을 적용하여AI 학습용 데이터를 구축함으로써 일자리를 만들어갈 예정이다.
ㅇ 특히, 청년과 취업준비생, 경력단절여성, 장애인 등에게 많은 일자리가 제공되고, 데이터 가공 전문성을 쌓을 수 있는 기회도 될 것으로 기대된다.
*’19년 AI 학습용 데이터 구축사업 분석결과, 일반적 데이터가공은 10억당 38.1명, 크라우드소싱 방식은 10억당 200명 일자리 창출 효과 발생
□ 아울러, 과기정통부는 ‘20년 추경예산을 통해 코로나19 이후 경기침체를 극복하기 위해 일자리 창출효과가 크고 AI모델 개발에 필수적인 AI 학습용 데이터 구축 사업을 확대 추진할 계획이다.
ㅇ 총 150개 종류의 AI 학습용 데이터를 구축하고 AI 통합 지원 플랫폼인 AI 허브(
www.aihub.or.kr)를 통해 무료 개방할 계획이다.
□ 과기정통부는 중소기업과 스타트업 등은 비용부담과 인력부족 때문에 필요한 AI 학습용 데이터를 직접 구축하는데 어려움 많아서, 양질의 데이터 확보에 대한 수요가 크다고 밝히며,
ㅇ 시장에서 필요한 양질의 AI 학습용 데이터를 많이 확보하는 것이 단기간에 우리나라 AI 경쟁력을 끌어 올릴 수 있는 해결책이 될 수 있다고 강조하였다.
ㅇ 과기정통부는 이번 추경을 통해 AI 학습용 데이터 구축을 대규모로 확대․구축하여 데이터 댐에 모으고,다양한 AI 기술연구, 상용화 서비스 개발에 활용할 수 있도록 지원하겠다고 하며,
-이를 통해,양질의 일자리 창출과 경제성장의 새로운 원동력을 확보할 수 있을 것으로 기대한다고 밝혔다.