‘대기업-스타트업 해결사’ 2탄, 이번엔 인공지능!
- 국내 최대규모 인공지능 스타트업 대회 과제 공개 -
□ 대기업, 선배벤처 등이 제시한 인공지능(AI) 과제를 국내 스타트업의 기술력으로 해결하는 ‘인공지능(AI) 챔피언십’ 과제 공개
* 국내최대 스타트업행사인 컴업(COMEUP) 2020(11월)의 특별 행사로 진행될 예정이며, 우승팀에게는 사업화, 기술개발, 기술특례보증 등 최대 25억원 연계지원
□ 제조, 의료, 영상, 소비생활 분야를 주제로, 국내 굴지의 대기업·선배벤처 등 8개 기업이 인공지능(AI) 과제와 내부 데이터 최초 공개
* (제조)LG사이언스파크, 한국타이어앤테크놀로지, (의료)고신대 복음병원,(영상)KDX한국데이터거래소, (소비·생활)네이버, 비씨카드, 우아한형제들, 위메프
대기업, 선배벤처 등이 고민하는 문제를 풀기 위해, 인공지능(AI) 스타트업이 해결사로 나선다!
중소벤처기업부(장관 박영선, 이하 중기부)는 올해 처음으로 개최되는 국내 최대규모 인공지능(AI) 스타트업 대회 ‘인공지능(AI) 챔피언십’의 대기업과 선배벤처 등이 제시한 8개의 인공지능(AI) 과제를 공개하며 과제에 참가할 스타트업을 9월 9일(수)부터 9월 29일(화)까지 모집한다고 밝혔다.
인공지능(AI) 챔피언십은 지난해 12월 발표된「인공지능 국가전략」에 따라 올해 초부터 기획되어온 대회로써, 지난 7월 30일 개막한 ‘연결의 힘, 디지털 드림9’에 이어, 대(기업)-스타(트업) 해결사 플랫폼* 2탄으로 추진된다.
* 대기업이 고민하는 자사의 문제를 공개하고 이를 스타트업의 기술로 해결
대기업이 제시한 과제를 해결하는 ‘연결의 힘, 디지털 드림9’과 달리 인공지능(AI) 챔피언십에서는 대기업과 선배벤처가 제시한 과제를 1)데이터에 기반하여 2)인공지능(AI) 기술로 해결한다는 점에서 새롭게 시도되는 대회라고 할 수 있다.
인공지능(AI) 챔피언십이 그동안의 인공지능(AI) 대회들과 다른 특징은 크게 두가지이다.
첫째, 지금까지 공개되지 않았던 대기업과 선배벤처 등이 보유한 양질의 데이터가 최초 공개된다.
대기업들이 4차 산업혁명 시대에 중요자산인 ‘데이터’를 스타트업과의 협업을 위해 과감히 제공함으로써, 새로운 상생의 생태계가 열리고, 대중소 가치사슬에도 긍정적 변화가 일어날 것으로 기대된다.
두번째, 과제 해결을 위한 인공지능(AI) 기술력 뿐만 아니라 이를 활용한 제품·서비스화 방안을 스타트업이 대기업에 역제안한다.
이는 그간의 인공지능(AI) 대회들이 인공지능(AI) 기술력(알고리즘)에 초점이 맞춰지다보니, 대회 이후 실질적인 제품·서비스로 이어지는데 다소 한계가 있었던 점을 보완하기 위한 것으로,
대기업이 생각하지 못했던 신선한 사업화 아이디어를 스타트업이 역제안함으로써, 대회 이후에도 스타트업과 대기업의 협업이 지속될 수 있을 것으로 기대된다.
인공지능(AI) 챔피언십에 과제를 출제한 기업은 총 8개사로, 각 분야를 대표하는 국내 굴지의 대기업, 선배벤처 등이 참여한다.
분야별로 보면 제조분야는 △LG사이언스파크, △한국타이어앤테크놀로지, 의료분야는 △고신대 복음병원, 영상분야는 MBN의 자회사인 △KDX한국데이터거래소, 소비생활분야는 △네이버, △비씨카드, △우아한형제들, △위메프가 참여했다.
< 인공지능(AI) 챔피언십 과제 내용 요약 >
분야
출제기관
과제내용
데이터셋
제조
LG사이언스파크
· 부품 검사 단계에서 완제품 불량 여부를 예측하고, 원인을 설명하는 AI
· 주파수별 소음진폭(Hz), 부품표면온도 등
한국타이어앤테크놀로지
· 외관상 보이지 않는 타이어의 내부 부적합 여부와 10가지 결함유형을 판별하는 AI
· 타이어 완제품의 X-ray이미지
의료
고신대
복음병원
· 보행이상의 패턴을 분석하고 낙상의 위험을 예측하는 AI
· 어지럼증 환자(780명)의 보행데이터
영상
KDX한국
데이터거래소
· 영상속 인물이 어떤 행동을 하고 있는지 분류하는 AI
· 출연자 이름이 적혀있는 500시간 분량의 영상
소비
·
생활
네이버
· 고객의 전화 음성을 보다 빠르고 정확하게 텍스트로 변환하는 AI
· 한국어 음성 데이터 및 해당내용 텍스트
비씨카드
· 소상공인의 단골고객 모형을 정의하고, 매출 등의 영향을 분석하는 AI
· 지역별 카드 사용이력, 사용자 유형(성별, 나이등)
우아한 형제들
· 리뷰, 평점 조작 사례를 자동판별하는 AI
· 업소 정보, 주문 정보, 평점 등
위메프
· 고객의 구매패턴 분석을 통한 맞춤형 홍보 콘텐츠를 제공하는 AI
· 로그인·아웃 시간, 클릭수, 구매품목, 금액 등
기업에서 제공하는 데이터는 모두 비식별화해 제공될 예정이다.
8개 과제를 세부적으로 살펴보면
< 제조 데이터 분야 >
① LG사이언스파크는 「부품 검사에서 완제품 불량을 예측하고, 그 원인을 설명할 수 있는 인공지능(AI)」과제를 출제했다.
현재는 완제품 검사 시 발생하는 소음을 측정해 부품의 불량을 판별하고, 원인을 추적조사하고 있다. 다만, 계절 등 작업 환경에 따라 정상 부품임에도 불량으로 판정되는 경우, 이를 조사하기 위한 추가 생산 손실을 줄일 수 있을 것으로 기대하며, 부품 검사시 측정했던 부품 표면온도, 소음의 진폭, 해당 부품 완제품 적용 시 판정 결과 등이 기록된 과거 8개월치 약 50만 여개 데이터를 제공한다.
② 한국타이어앤테크놀로지는 「외관상 보이지 않는 타이어의 내부 부적합 여부와 10가지 결함 유형를 판별하는 인공지능(AI)」과제를 출제했다.
현재는 타이어 엑스-레이(X-ray) 사진을 고숙련 작업자가 눈으로 일일이 확인하여 판별중으로, 인공지능(AI)를 통해 작업의 효율성을 높이고 결함 유형을 데이터화할 수 있을 것으로 기대되며, 타이어 엑스-레이(X-ray) 사진 약 5,000개와 10가지 결함 유형이 표시된 데이터를 결합하여 제공한다.
< 의료 데이터 분야 >
③ 고신대 복음병원은 「보행이상의 패턴을 분석하고, 낙상의 위험을 예측하는 인공지능(AI)」과제를 내고, 류마티즘, 어지럼증 등 보행이상 환자 780명의 보폭, 균형 등이 기록된 보행 데이터를 제공한다.
해당 과제를 통해 보행이상 환자를 위한 다양한 헬스케어 제품과 서비스 방안이 도출될 것으로 보이며, 특히 낙상사고 위험이 높은 산업 현장 근무자의 사고 예방과 노인 낙상예방에도 큰 도움이 될 것으로 기대된다.
< 영상 데이터 분야 >
④ KDX한국데이터거래소는 「영상속 인물이 어떤 행동을 하고 있는지 인식하고 분류하는 인공지능(AI) 개발」과제를 출제했다.
이를 위해, MBN에서 실제 방영된 약 1만1,000개의 500시간 분량의 영상과 290개의 행동패턴을 결합한 데이터를 제공할 예정이다.
< 소비생활 데이터 분야 >
⑤ 네이버는 「사람의 음성을 보다 빠르고 정확하게 텍스트 변환하는 인공지능(AI)」를 과제로 출제하였다. 이는 현재 네이버가 개발 중인 AiCall 프로젝트*의 인식 정확도를 높이기 위함으로, 네이버에 등록된 식당 예약과 관련한 약 6만건의 음성파일과 텍스트를 제공한다.
* 음성을 텍스트로 변환 후 인공지능(AI)가 자동으로 문의 응대하는 서비스
⑥ 비씨카드는 「BC카드 회원의 소비데이터를 활용하여 소상공인 업종별 단골고객을 정의하고 매출 등의 영향을 분석하는 인공지능(AI) 개발」과제를 출제했다.
이는 코로나19로 인해 소상공인이 어려움을 겪는 상황에서, 기존의 매출 등 금융이력에서 벗어나 단골 고객의 여부를 새로운 신용정보로 활용하기 위함으로, 서울에 위치한 비씨카드 가맹점에서 비씨카드 회원이 ’19.1~12월간 이용한 소비데이터(구매실적, 품목 등)를 제공한다.
⑦ 우아한형제들은 「배달의민족에서 발생한 리뷰나 평점과 같이 주문에 영향을 미치는 요소들이 조작된 사례를 판별하는 인공지능(AI)」과제를 출제했다.
최근 배달수요가 늘면서 평점, 순위 등을 조작하는 사례도 함께 늘어나는 과제를 해결하기 위함으로, 100만 건 이상의 업소별 주문 내역과 평점 등의 주문정보를 제공한다.
⑧ 위메프는 「고객의 구매패턴 분석을 통한 맞춤형 홍보 콘텐츠를 제공하는 인공지능(AI)」과제를 출제하고, 회원의 구매 이력 데이터 약 380만건을 제공한다.
대회는 총 3단계에 거쳐 진행된다.
1단계는 과제별 샘플데이터를 바탕으로 스타트업이 서면 작성한 인공지능(AI) 알고리즘 방향(흐름도)와 제품서비스화 아이디어를 평가해 10월초 48개 스타트업(과제별 6개사, 8개 과제)을 선정할 계획이다.
2단계로 선정된 48개 스타트업에게 8개 과제별 데이터 셋 전체본이 제공되며, 본격적으로 인공지능(AI) 알고리즘을 개발하게 된다.
이후 대면평가를 통해 인공지능(AI) 알고리즘의 정확성과 제품·서비스화 방안의 창의성, 현실성 등을 중심으로 평가해 본선에 오를 24개 스타트업(과제별 3개사, 8개 과제)을 10월 중순 선정한다.
2단계에서 선정된 24개 스타트업에게는 해결방안 고도화를 위한 약 한달 간의 시간을 주어지며, 이기간 동안 3단계 진출을 위해 과제를 출제한 기업과 인공지능(AI) 전문가가 밀착 멘토링을 제공할 계획이다.
마지막 3단계인 본선 피칭대회는 오는 11월, 컴업(COMEUP) 2020의 스페셜 행사로 진행되며, 과제별 우승팀에게는 3,000만원 내외 상금과 최대 25억원 규모 정책지원을 연계할 계획이다.
* 사업화자금 (최대 1억원), 기술개발 (최대 4억원) 및 기술특례보증 (최대 20억원)
신청 기간은 9월 9일(수)부터 9월 29일(화)까지이며, 인공지능(AI) 챔피언십에 대한 보다 자세한 정보와 신청 방법 등은 K-스타트업(K-Startup) 창업지원포털(
www.k-startup.go.kr)이나 ☎1357를 통해 알 수 있다.
한편, 인공지능(AI) 챔피언십에는 일반인도 쉽게 보고 즐길 수 있는 인공지능(AI) 레이싱, 인공지능(AI) 축구, 인공지능(AI) 게임 등의 부대행사(이벤트)도 함께 개최될 예정으로, 이를 주관하는 ’아마존웹서비스(Amazon Web Serivces)‘, ’카이스트(KAIST)‘, ’마이크로소프트사(Microsoft)‘의 누리집를 통해 신청하면 된다.
< 인공지능(AI) 챔피언십 이벤트(부대행사)>
대회명
대회내용
접수
AWS DeepRacer
(아마존웹서비스)
· AWS가 개발한 1/18크기 자율 경주용 차량에 강화학습 모델을 입력하여 정해진 트랙을 가장 빠르고 정확하게 완주하는 대회
· 9.9~10.6
· 향후 공지(k-startup.go.kr)
MINECRAFT
(마이크로소프트)
· 게임 ’마인크래프트‘ 에 알고리즘을 입력하여 미션을 가장 빠르게 완수하는 대회
· 9.18~10.18
· minecraft-contest.kr
AI WorldCup
(카이스트)
· 카이스트가 자체 개발한 축구 게임에 AI 알고리즘을 입력하여 축구 대결을 펼쳐 승리팀을 선발하는 대회
· 9.14~10.8
· aiworldcup.org/registration
이 보도 자료와 관련하여 보다 자세한 내용이나 취재를 원하시면 중소벤처기업부 기술창업과 김승택 사무관(☎042-481-4386), 손희찬 사무관(☎042-481-8947), 김남윤 주무관(☎042-481-8921)에게 연락주시기 바랍니다.
참고1
인공지능(AI) 챔피언십 개요
◦ (본선 일시) ‘20.11.19.(목) ~ 21(토) * 장소 추후 재공지
◦ (경진대회) 스타트업이 대기업·선배벤처 등이 제시한 문제를 AI 기술로 해결하고, 문제보다 더 고도화된 협업 사업화 모델도 제안
* ’디지털 드림9‘과의 차이점 : 대기업 및 선배벤처 등이 과제해결을 위해 그동안 공개하지 않던 자사의 빅데이터를 공개
◦ (부대행사) 누구나 쉽게 AI기술을 보고 즐길 수 있는 있는 AI레이싱, AI축구, AI게임 등으로 구성
경진대회
부대행사
▪(AI기술력) 알고리즘 제출·평가
▪(기획력) 대기업과 협업을 통해 실현 가능한 사업화 모델 평가
▪(대회형) AI자율주행 레이싱(AWS), AI축구(카이스트), AI게임(MS)
참고2
인공지능(AI) 챔피언십 8개 과제 세부내용
* 실제 데이터 제공 시 일부 변동될 수 있음
1. 제조데이터 분야
□ (1-1) LG사이언스파크 : 부품 검사 단계에서 완제품 불량 여부를예측하고, 원인을 설명하는 AI 개발
□ 출제배경
◦ 완제품 검사 시 발생하는 소음을 측정하여 부품의 불량을 판별하고, 그 원인을 추적 조사하고 있음
◦ 다만, 계절 등 작업 환경의 변화에 따라 정상 부품임에도 불구, 완제품의 소음이 정상범위를 벗어나 불량 판정되는 문제 발생
- 이로 인해, 작업자가 원인 파악 및 수정 시간이 소요되므로, 이 기간동안 생산 손실 등이 발생
⇨ 완제품 조립 전, 부품 제조 단계에서 불량 여부 및 원인을 미리 예측할 수 있는 AI 알고리즘 개발 필요
□ 제공되는 데이터
◦ 지난 8개월 동안 수집된 50만개 부품의 검사 데이터로써, 부품 표면온도와 발생 소음이 결합된 데이터를 제공
< 데이터 형태(예시) >
번호
측정시간
측정위치
온도
소음
불량여부
1번
연,월,일,시,분,초
센서번호(s1~s8)
00ㅇ
0~10000Hz
0–정상, 1-불량
□ 과제
◦ 부품 검사 데이터를 기반으로 완제품 불량 판정 결과를 미리 예측하고 원인/특성을 설명해줄 수 있는 AI 알고리즘 필요
□ 판정기준 : AI 시스템이 판별한 결과가 실제 불량여부와 얼마나 일치하는지 정확도 측정
□ (1-2) 한국타이어앤테크놀로지 : 타이어 X-ray로 결함을 판별하는 AI 개발
□ 출제배경
◦ 타이어의 외관상 보이지 않는 내부 부적합을 판별하기 위해, X-ray 사진을 촬영하여 고숙련 작업자가 직접 확인
- 이에, 고숙련자의 피로도가 증가, 초보자의 숙련도 향상에 장시간 소요
◦ 결함 유형을 별도 기재하고 있으나, 장비 시스템 한계상 이미지 파일과 연계가 어려운 상황
⇨ 판정의 효율성을 높이고, 결함 유형별로 데이터화하여 선행 제조공정의 개선 등에 지속 활용 가능한 AI 개발 필요
□ 제공되는 데이터
① 타이어 X-ray 사진 약 5,000여장(적합 3.7천장, 부적합 1.3천장) 이미지데이터 제공
② 10가지 결함 여부를 표시(레이블링)한 타이어 데이터를 추가 제공
< 데이터 형태(예시) >
□ 과제
◦ AI로 타이어의 부적합 여부를 자동으로 판독하고, 결함 유형·세부 타입을 도출
□ 판정기준 : AI 시스템이 판별한 결과가 실제 불량여부·결함유형과 얼마나 일치하는지 정확도 측정
2. 의료데이터 분야
□ 고신대 복음병원 : 보행이상 환자 사전체크 AI 개발
□ 출제배경
◦ 신경병증, 파킨스병, 뇌 손상, 어지럼증, 근골격계 질환 등 보행이상 환자의 경우 산업현장에서의 낙상과 연관된 사고위험이 대단히 높으며,
- 이를 사전에 예방·체크할 수 있다면 산업현장의 안전사고를 많이 줄일 수 있을 것으로 기대
◦ 고신대 복음병원(부산)은 인근의 포스코, 조선업체 등 산업현장에 근무하는 보행이상 환자와 부산, 경남 지역의 노인환자가 자주 방문하여, 그들의 보행데이터를 수집해왔음
⇨ 낙상위험 징후를 사전에 알려주는 AI 개발 필요
□ 제공되는 데이터
◦ 보행이상 환자의 특징을 알아낼 수 있는 고신대병원 보행이상 질병 환자 780명의 보행데이터
< 데이터 형태(예시) >
환자번호
성별
키/몸무게
나이
평형기능 비대칭 지표
보폭(왼)
보폭(오)
걸음속도
기타지표*
환자ID
남녀
cm/kg
year
%
cm
cm
m/s
* 보행불균형지수, 국면협응지수, 걸음걸이, 하지지지, 발끝밀기시간, 관절가동범위 등
□ 과제
◦ 새로운 환자의 보행데이터를 통해 보행이상 질병 환자 징후를 사전에 알려주는 AI 개발하고,
◦ 이를 활용한 비정상 보행인식 및 낙상 예측 헬스케어(손목시계 등) 제품·서비스화 방안 제시
□ 판정기준 : 질병의 종류에 따라 보행패턴을 분류, 보행패턴으로 질병의 경중을 예측, 헬스케어 제품으로의 사업화 아이디어 제시
3. 방송·영상데이터 분야
□ 한국데이터거래소(KDX) : 영상 속 인물의 행동을 인식하는 AI 개발
□ 출제배경
◦ 현재 방송사들은 영상 데이터에서 인물의 특정 행동을 찾기 위하여
- 자료 속에서 영상명과 시간 등을 수동으로 검색하고 인물의 행동을 육안으로 확인하여 신속한 영상 제작에 효율이 낮음
◦ 영상(촬영 원본)을 AI가 자동으로 분석해 일정 카테고리로 분류해 준다면 영상 제작의 효율성이 매우 높아질 것으로 기대됨
⇨ 영상 속 출연자의 행동을 자동으로 판별주는 AI 개발 필요
□ 제공되는 데이터
◦ MBN에서 실제로 방송된 500시간 분량의 영상 데이터 1만 1천개
- 290개의 행동 카테고리를 별도 제시
< 데이터 형태(예시) >
영상
자료
행동
카테고리
대분류
중분류
행동(한국어)
개인관리
제모하기
면도하기
□ 과제
◦ 500시간 분량의 영상데이터 속에 출연한 인물의 ‘행동’을 자동으로 인식하고 분류하는 AI 알고리즘 개발
□ 판정기준 : 출연자의 행동을 정확히 분류할 수 있는지 정확도 측정
4. 소비·물류데이터 분야
□ (4-1) 네이버 : 고객의 음성을 텍스트로 자동 변환하는 AI 개발
□ 출제배경
◦ 바쁜 소상공인을 대신해 메뉴나 점포 관련 문의 등 단순 전화 문의에 응대할 수 있는 Clova AiCall* 서비스를 준비 중에 있음
* 클로바 에이아이콜(Clova AiCall) : 소상공인부터 기업 고객센터까지 전화를 통한 문의 응대 및 예약 등을 진행할 수 있는 대화형 AI 서비스
◦ 이 외, 다양한 음성 서비스*가 제공되고 있으며 기술 고도화 필요
* 케어콜(CareCall) : 진료 예약부터 특수한 의료 상황의 환자 관리, 병원 및 보건 서비스 특화해피콜(HappyCall) : 고객만족도 조사 및 보험, 금융 상품 등 완전 판매 확인 전화, 고객 답변 수집에 특화
⇨ 이러한 AiCall 프로젝트를 진행함에 있어 음성인식 고도화가 주요 과제이므로 유망 스타트업과의 협업을 통해 진행 희망함
□ 제공되는 데이터
◦ 약 52시간 분량(60,000건)의 1차 가공된 식당 예약과 관련된 한국어 음성파일 및 텍스트
< 데이터 형태(예시) >
음성파일
발언자
텍스트
000.wav
AAAAA
단체 할인이 가능한 시간대가 있나요?
000.wav
BBAAA
애기들이 놀만한 놀이방이 따로 있나요?
□ 과제
◦ 제공데이터에 없는 새로운 고객의 한국어 음성을 텍스트로 변환
◦ 보다 작은 용량으로 정확하게 답변하는 AI 시스템 개발
□ 판정기준 : AI가 변환한 텍스트가 실제 발언내용과 얼마나 일치하는지 정확도와 모델 크기 측정
□ (4-2) 비씨카드 : 소상공인 단골고객 모형 AI 개발
□ 출제배경
◦ 금융정보 부족으로 정확한 신용평가가 어려워 자금을 지원받지 못했던 소상공인 등 금융소외계층을 대상으로, 단골고객이라는 개념을 도입하여 소상공인을 위한 금융상품을 개발
⇨ 중소/영세 점포를 대상으로 상권, 업종, 시기별 단골고객 매출 비중을 파악하여, 특별한 소상공인 금융서비스를 지원할 필요
□ 제공되는 데이터
◦ 서울에 위치한 가맹점을 대상으로 BC카드 개인회원이 해당 점포(업종, 소재지, 가입년월 등 속성)에서 2019.1월부터 12월까지 이용한 소비데이터(성별, 연령, 거주지 등)로 비식별 통계 처리하여 제공
◦ 매장정보와 회원정보가 결합 가능한 연계정보를 추가 제공
< 데이터 형태(예시) >
고객정보
기준년월
고객번호
성별
연령
사용지역
사용금액
매출건수
매장정보
기준년월
매장번호
업종코드
비씨카드 가입년월
매출건수
매칭정보
고객번호
기준년월
기준일자
업종명
매장번호
매출금액
매출시간
□ 과제
◦ 점포가 위치한 상권, 동종업종, 개업시기 등을 분석하여 단골고객 개념을 정의, 전체 매출에 미치는 영향을 분석하여 데이터로 검증 및 예측할 수 있는 AI 모형 개발
< 예시 >
A주유소를 방문한 B고객의
단골지수 분석
· B고객의 최근 6개월간 구매이력을 분석
→ A주유소가 위치한 강남구에서 매월 5회 이상 주유를 하고있으며, 최근 A주유소를 3회 연속방문
→ B고객은 A주유소의 단골고객이 될 가능성이 높음(지수화)
□ 판정기준 : 단골지수가 높은고객이 실제 재방문이 많았는지 판별
□ (4-3) 우아한형제들 : 주문 수, 리뷰 등 조작사례를 검열하는 AI 개발
□ 출제배경
◦ 코로나19로 인해 배달수요가 늘어나면서, 주문 수를 허위로 늘려 랭킹을 조작하거나 리뷰·평점을 조작하는 의심 사례가 급증
< 예시 1 >
· A 업소의 업주는 자신의 배민계정을 이용하여 지속적으로 가짜 주문을 일으키고, 5점의 리뷰평점을 부여했다.
· 이 현상을 인지한 배민은 업소에 확인차 연락을 취하였고, 맛집랭킹, 별점 등을 올리기 위해 가짜 주문을 일으켰다고 고백했다.
< 예시 2 >
· 온라인에서 리뷰를 관리해준다는 많은 광고를 접할 수 있는데 이들은 수많은 알바를 고용하여 가짜 주문을 일으킨다.
· 이들은 긍정 리뷰를 정성껏 달도록 하여 허위 리뷰를 만들어내고 있으며, 이용자들은 더는 리뷰를 믿을 수 없다고 한다.
◦ 현재 우아한 형제들은 여러 업소별 지표들을 이용하여 통계 모델을 생성, 위와 같은 예시들을 자동으로 인식하고 있음
⇨ 리뷰/평점 조작 이외에도 더 많은 조작 사례를 발굴하여 자동 검열하는 AI 개발이 필요한 상황
□ 제공되는 데이터
◦ 100만 건 이상의 업소별 주문데이터 및 평점, 주문 요청사항 등 텍스트 데이터
< 데이터 형태(예시) >
업소명
등록일
업소주소
메뉴명
메뉴가격
메뉴품목
평점
AA
연,월,일,시
시, 구, 동, 번지
BB
CC원
치킨, 피자 커피 등
DD점
□ 과제
◦ 주문·텍스트 데이터를 분석하여, 리뷰·평점, 주문 수 조작 등 다양한 오용 사례를 AI로 판별
□ 판정기준 : 조작 사례를 얼마나 찾아내는지 정확도 측정, 예시 이외의 조작사례 발견 여부, 사용 기술에 대한 적절성
□ (4-4) 위메프 : 고객별 맞춤 제품을 제안하는 AI 개발
□ 출제배경
◦ 그동안 위메프는 주문데이터를 분석하여 고객별 구매패턴 (의류, 음식, 가전제품)을 분석하고, 이에 맞는 품목별 홍보 콘텐츠 제공
◦ 주문 성향을 구분하는 품목기준이 세분화되어있지 않고, 단골고객* 여부를 고려하고 있지 않아 맞춤형 홍보 및 성과창출에 한계
* (구매횟수) 한달내 4회 이상, (구매주기) 1주일내 재주문, (로그인 시간) 30분 이상
◦ 이에 따라, 다수의 이용자들이 자신에게 가장 적합한 상품을 추천하는 서비스에 대한 요구 증대
⇨ 고객군을 1~9 등급으로 세분화하여, 고객활동지수에 따른 등급화 및 활동추이에 따른 등급변화 예측 필요
□ 제공되는 데이터
◦ 지난 4개월(4~8월)간 380만건의 구매이력 데이터(구매고객 수, 금액 등)
< 데이터 형태(예시) >
구매자
로그인
로그아웃
클릭횟수
구매품목
금액
AA
연,월,일,시,분,초
연,월,일,시,분,초
B회
의류
잡화
시계
C원
□ 과제
◦ 고객별 단골고객 여부 및 세분화된 품목기준에 따른 구매패턴을 분석하여, 개인 맞춤형 홍보 콘텐츠를 제공하는 AI 개발
◦ (타사업 활용) e커머스 분야 모든 업체에 관련 시스템을 맞춤형 홍보시스템을 개발해주는 사업으로 확장 가능
□ 판정기준 : 데이터를 기반으로한 고객 등급화, 고객활동지수를 통한 등급변화 예측이 가능한지 판별
참고3
부대행사 대회내용
□ (AI레이싱) 아마존웹서비스 : 미니자동차 자율주행 레이싱 대회
□ 대회내용
◦ AWS가 자체 개발한 자율주행 미니자동차(AWS 딥레이서)에 강화 학습 모델을 입력하여 정해진 트랙을 누가 더 빠르고 정확하게 완주하는지 겨루는 대회
◦ 1위팀은 각국의 우승자가 모여 경쟁하는 국제행사인 ’AWS Deep Racer Championship(미국, 12월 예정)‘의 참여 기회 제공
< AWS 딥레이싱 대회 개요 >
· AWS가 집중하고 있는 자율주행 관련 인공지능 투자의 일환으로 매년 개최
· 정해진 트랙을 빠르고 정확하게 완주하는지를 대결
□ 진행방식
◦ 온라인 가상 트랙을 통해 예선을 진행하여 20개팀을 선발하고, AI 챔피언십에서 최종 결승전을 개최
◦ 참가팀당 레이싱 기회를 2회 제공하고, 높은 기록으로 순위 결정
□ 향후일정 : 접수(9.9~) → 예선(11월초) → 본선(11.19, 20개팀)
온라인 예선 (가상 트랙)
딥레이싱 차량
□ (AI게임) 마이크로소프트 : 마인크래프트 미션을 AI로 수행
□ 대회내용
◦ 게임 ’마이크로소프트 마인크래프트*‘에서 수행할 미션을 주고, 이를 위한 알고리즘을 입력하여 누가 더 빠르게 미션을 완수하는지 겨루는 대회
* 가상 공간에서 게임 캐릭터가 다양한 미션을 수행하는 세계적인 인기 게임
☛ (참고) 청와대는 올해 어린이날을 기념하여 마인크래프트를 통한 ’청와대 랜선 특별 초청 행사‘를 진행
◦ 중·고등학생 대상으로 AI 기초인 코딩 교육을 위해 진행하고, 상위 3명은 MS에서 상장 및 상품 등을 수여
□ 진행방식
◦ 온라인으로 예선을 진행하여 20명을 선발하고, 본선은 AI 챔피언십 3일차에 개최하여 최종 순위 결정
□ 수행미션
◦ 제한시간 내에 누가 더 빠르게 미로안에 있는 보물을 찾는지 측정
< 미로에서 보물 찾기 >
- 게임속 미로에서 로봇을 움직이도록 코딩
하여 누가 더 빠르고 효과적으로 보물을
발견하는지를 측정하여 순위 결정
□ 향후일정 : 접수(9.18~) → 예선(10월중) → 본선(11.21, 20명)
□ (AI 월드컵) 카이스트 : AI 알고리즘간의 축구 대결
□ 대회내용
◦ 카이스트가 자체 개발한 축구 게임에 AI 알고리즘을 입력하여 축구 대결을 펼쳐 승리팀을 선발하는 대회
- 대학생 이상의 일반인이 참여하는 본선리그와 초·중·고등학생이 참여하는 주니어리그로 이원화
◦ 리그별 상위 3개팀에 대해 카이스트에서 USD 1,200 상당의 상금 제공 (1위 USD 600, 2위 USD 400, 3위 USD 200)
< 카이스트 AI Worldcup 개요 >
· 카이스트 공과대학에서 진행하는 AI 축구대회로 2017년 처음으로 개최
· AI 알고리즘을 통해 화면상 보이는 네모꼴 가상 선수에 축구 규칙과 승리 전략을 사전에 학습
· AI 축구경기를 분석하는 AI 해설자, AI 리포터도 구성
□ 진행방식
◦ 사전에 제작한 AI 알고리즘을 경기 전에 제출하고, 경기당 15분 내외로 토너먼트 형태로 진행
□ 향후일정 : 접수(9.14~) → 예선(10월중, 20개팀) → 본선(11.21, 8개팀)
AI 리포터
캐스터 중계 등 경기장면