[CBC뉴스] SK텔레콤이 7일 국립국어원과 업무 협약을 체결하고, 국립국어원의 언어 정보를 활용하여 한국어에 최적화된 차세대 인공지능(AI) 언어 모델을 개발하기로 했다고 밝혔다.
차세대 AI 한국어 모델은 사람의 능력 수준으로 평가되는 GPT-3와 유사한 성능을 발휘하는 한국어 범용 언어 모델(이하 GLM, General-Purpose Language Model)로, 언어 관련 문제풀이, 글짓기, 번역 및 주어진 문장에 따라 간단한 코딩을 수행할 수 있는 GPT-3의 기능을 한국어에서도 구현할 수 있게 된다.
GPT-3는 Open AI가 개발한 영어 기반의 최신 AI 언어 모델로, 기존 GPT-2보다 자연스러운 언어 표현이 가능하고 범용적 사용이 가능하다.
GLM은 일상의 감성대화, 다양한 업종의 고객센터 대화 뿐 아니라 시사, 문학, 역사, 게임에 이르기까지 다양한 영역의 언어 활동에 적용될 수 있으며, 이를 기반으로 새로운 산업 분야에 추가 활용될 수 있을 것으로 기대된다.
SKT가 개발하는 GLM은 1,500억개의 매개변수를 가진 거대 언어 모델로 개발될 예정이다. 최신 언어 모델인 GPT-3가 1,750억개의 매개변수를 가지고 있어 이전 버전인 GPT-2보다 100배 이상 크고, 보다 높은 정확도와 넓은 활용도를 갖고 있는 점을 감안하면, GLM은 한국어 AI 언어 모델의 결정판이 될 것으로 예상된다.
매개변수란 서로 다른 함수에 공통적으로 영향을 미치는 변수로, 일반적으로 매개변수가 많을수록 언어 모델의 성능이 높아지다고 한다.
한편 SKT는 올해 말까지 GLM을 개발하여 내부 서비스를 통해 모델 성능을 검증한 후 상용화를 진행할 예정이며, 다양한 서비스에도 적용할 계획이다. 또한, 한국어 언어모델 성능 평가 방법 개발 및 한국어 데이터 품질 평가 연구도 추진할 예정이라는 것이다.
▶설명의 神을 만나고 싶다면?
▶핫이슈가 궁금할 때, 지금 클릭!
CBC뉴스ㅣCBCNEWS 정종훈 기자 press@cbci.co.kr