플리토, LLM 강화학습용 데이터 구축 플랫폼 기능 고도화 완료

  • 박현아
  • 발행 2023-12-27 11:14
국내외 수요 급증하는 ‘인간 피드백형 강화학습(RLHF)’ 데이터 구축에 최적화된 플랫폼챗봇 답변 평가 및 수정, 요약, 이미지 내용 기술 등 고품질 강화학습용 데이터 생산에 용이이정수 대표 “LLM 성능 향상에 강화학습은 필수, 10년간 쌓은 노하우로 글로벌 사업 경쟁력 확보”


인공지능 언어 데이터 기업 플리토가 자사 통합 크라우드소싱 플랫폼의 기능 고도화를 완료했다고 27일 밝혔다. 이번 플랫폼 고도화 작업으로 생성형 AI를 포함한 거대언어모델(LLM)의 성능 향상을 위한 ‘인간 피드백형 강화학습(RLHF: Reinforcement Learning from Human Feedback)’용 데이터 구축이 더욱 용이해졌다는 것이 회사측 설명이다.

‘인간 피드백형 강화학습(RLHF)’은 사람 작업자의 피드백을 보상 신호로 활용해 AI 모델의 언어 출력 생성 과정을 학습시키는 방식으로, 거대언어모델(LLM)의 자연스러운 대화 생성, 정확도 높은 정보 검색, 다국어 번역 등 고품질 언어 생성을 위한 성능 향상을 위해 전 세계적으로 수요가 크게 증가하고 있다.

플리토는 자체 플랫폼에 총 10가지 유형의 강화학습 데이터 생산을 위한 기능 및 작업 환경 구축을 완료했다. △챗봇의 답변을 평가하고 정확한 답변으로 수정하는 작업 △주어진 이미지의 내용을 기술하는 작업 △주어진 글을 요약 등 요청에 맞게 편집하는 작업 △주어진 명령에 따라 답변을 도출하는 작업 △전문 분야별 파인튜닝을 위한 프롬프트-응답 데이터셋 구축 작업 △자동 코딩을 위한 코딩 생성 작업 △정보 검색 시 정확한 결과 도출을 위해 시스템이 취하는 과정의 생성 작업 △멀티모달 학습을 위한 텍스트, 이미지, 음성 등의 태깅 작업 등이 포함된다.

블룸버그 산하 연구기관인 블룸버그 인텔리전스의 조사 결과에 따르면, 생성형 AI 시장은 향후 10년간 42%의 연평균 성장률로 급성장할 것으로 예상된다. 텍스트 요약, 콘텐츠 생성, 감정 분석, 다양한 산업 및 분야별 챗봇, 실시간 통번역 서비스 등 생성형 AI 기반 서비스의 수요 증가로 약 2800억달러(한화 약 360조)의 새로운 소프트웨어 수익이 창출될 것으로 전망하고 있다.

<저작권자 ⓒ 더뉴스프라임, 무단 전재 및 재배포 금지>

박현아 기자 다른기사보기