공공기관 프로젝트 경험, 플랫폼 활용 능력, 전문인력 보유 등으로 안정적인 사업 수행 능력 인정받아구축된 병렬 말뭉치 데이터는 정부 언어문화산업 확산 위한 인공지능 기술 개발에 적극 활용될 것으로 기대
인공지능(AI) 언어 데이터 기업 플리토가 국립국어원이 주관하는 ‘한국어-외국어 병렬 말뭉치 구축 사업’ 수행기업으로 4년 연속 선정되었다고 21일 밝혔다.
‘한국어-외국어 병렬 말뭉치 구축’은 문화체육관광부 산하 국립국어원이 언어문화산업을 활성화하기 위해 2021년부터 인공지능(AI) 기술을 활용하여 언어 데이터 환경을 구축하는 사업이다. 올해 사업은 경희대학교산학협력단이 주 수행하고 플리토가 참여하는 형태로 진행될 예정이다. 규모는 약 46억원으로, 플리토는 그중 20억9000만원 규모에 해당하는 병렬 말뭉치 구축을 맡게 된다.
플리토는 오랜 기간에 걸친 프로젝트 경험, 자체 플랫폼을 활용한 데이터 구축 능력, 그리고 전문 번역가 및 언어 전문가를 보유한 점을 토대로 안정적인 말뭉치 구축 능력을 인정받아 4년 연속 참여 기업으로 선정되었다.
플리토가 수행하는 말뭉치 구축 언어는 총 9개이며, 해당 언어는 베트남어, 인도네시아어, 태국어, 인도 힌디어, 캄보디아 크메르어, 필리핀 타갈로그어, 러시아어, 우즈베크어, 영어다. 언어별로 약 140만 어절로 총 1260만 어절을 구축할 계획이다. 올해 사업에서도 지난해와 마찬가지로 기존 언어 외에 영어 데이터를 추가 구축하여 한국어-영어 병렬 말뭉치 데이터의 활용도를 극대화할 예정이다.
이번 사업을 통해 구축된 언어 데이터는 번역 소프트웨어 및 자연어처리 기술 등 정부의 문화산업 확산을 위한 인공지능 기술 개발에 적극적으로 활용될 것으로 전망된다. 아울러 아시아 권역에서 저자원언어로 분류되는 언어 데이터가 풍부하게 구축되면서 언어적인 불균형을 해소하고 국가 간 문화 교류를 효과적으로 촉진할 것으로 기대된다.
이정수 플리토 대표는 “언어 데이터 구축 경험과 전문성을 인정받아 4년 연속으로 정부 말뭉치 사업에 참여할 수 있어 영광”이라며 “정부 육성 AI 분야에서 필요로 하는 양질의 언어 데이터를 지속적으로 공급하여 우리나라 AI 산업이 글로벌 우위에 설 수 있도록 선도적인 역할을 수행하겠다”고 밝혔다.
<저작권자 ⓒ 더뉴스프라임, 무단 전재 및 재배포 금지>
박현아 기자 다른기사보기