상단여백

HOME 피플경제 ICT•Block Chain
카카오 AI, 한국어 독해능력 인간보다 ‘한수 위’
카카오 AI 스피커 '카카오미니'. 사진=카카오

인간보다 언어 능력이 앞선 인공지능(AI)이 탄생했습니다. 카카오는 자체 개발한 AI 언어모델이 한국어 학습 데이터 ‘KorQuAD’(The Korean Question Answering Dataset)를 바탕으로 한 기계 독해 능력 평가에서 91.85점을 받으며 1위를 차지했다고 31일 밝혔습니다.

이는 평가 주최인 LG CNS가 인간의 문장 판별 및 독해 능력 수준(Human Performance)이라고 밝힌 91.20점보다 0.65점 높은 수치입니다. AI가 인간보다 높은 점수를 기록한 것은 이번이 처음입니다.

LG CNS가 운영하는 기계 독해 능력 평가는 미국 스탠포드 대학에서 시작된 AI 언어지능 연구용 질의응답 학습 데이터셋인 SQuAD(The Stanford Question Answering Dataset)와 동일한 방식으로 구현됩니다.

LG CNS는 지난해 12월 한국어 학습을 위한 데이터인 KorQuAD를 구축해 오픈소스로 공개했습니다. 누구든지 자체 개발 AI 언어모델을 제출하면 성능을 공식 평가해주는 것입니다.

평가는 데이터셋에서 추출한 내용을 질문으로 제시하고, 이에 대해 개발 모델이 답을 찾아내는 방식으로 이뤄집니다.

예컨대 “아이유는 1993년 5월 16일 서울특별시에서 태어났으며, 경기도 하남시와 의정부시를 거쳐 서울특별시 광진구에서 자랐다. 초등학교는 하남시의 하남천현초등학교에서 3학년까지 다니다가 서울 광진구의 서울양남초등학교로 전학가 졸업하였다”와 같은 지문이 주어지고 “아이유가 졸업한 초등학교는 어디인가?”라는 질문에 대해 “서울양남초등학교”라는 정답을 찾아내는 식입니다.

이번에 평가받은 카카오의 AI 언어모델(모델명 BERT LM fine-tuned (single) + KHAIII)은 구글의 AI 언어모델 BERT(Bidirectional Encoder Representations from Transformers)에 카카오의 형태소 분석기 ‘khaiii(Kakao Hangul Analyzer III)’를 접목한 것입니다.

조사의 사용과 어미의 다양한 변형 등 한국어의 고유 특성에 최적화됐다는 설명입니다. 카카오는 지난해 말 딥러닝 기술 기반의 형태소 분석기 khaiii를 국내 최초 오픈소스로 제공하는 등 국내 AI 기반 언어지능 연구에 심혈을 기울이는 중입니다.

김응균 카카오 자연어처리파트의 파트장은 “이번 평가 결과는 카카오의 인공지능 자연어 처리 기술을 활용해 인간의 독해 능력을 넘어서는 최초의 모델을 구현했다는 것”이라며 “새롭게 개발한 언어모델 기술을 스마트 스피커 카카오미니에 적용하기 위한 연구를 진행 중”이라고 밝혔습니다.

이수형 기자  press@cbci.co.kr

<저작권자 © CBC뉴스, 무단 전재 및 재배포 금지>

이수형 기자의 다른기사 보기
Do you want to hang out with us?
김종민 더불어민주당 의원, 청문회 질의
여상규 법사위 위원장, 청문회 질의
조국 법무부 장관 후보자 '인사청문회 여야 격돌'
기사 댓글 0
전체보기
첫번째 댓글을 남겨주세요.
여백
여백
피플경제 - 사람이 경제다
PREV NEXT
여백
청국정- 청와대•국회•정부
PREV NEXT
여백
세상사 - 무슨일이!
PREV NEXT
여백
여기는 - 전국네트워크
PREV NEXT
여백
컬쳐TV- 건강과문화
PREV NEXT
여백
Ent - 스타팅
PREV NEXT
여백
여백
Back to Top