업스테이지, 한글 데이터 확보 위해 ‘1T 클럽’ 발족

384

[아이뉴스24 박진영 기자] 업스테이지는 고성능 거대언어모델(LLM) 개발에 한국어 데이터 부족 문제 해결을 위해 고성능 ‘1T 클럽'(1조 토큰 클럽)을 발족한다고 14일 밝혔다.

업스테이지는 고성능 거대언어모델(LLM) 개발에 한국어 데이터 부족 문제 해결을 위해 고성능 ‘1T 클럽'(1조 토큰 클럽)을 발족한다. [사진=업스테이지]

1T 클럽은 텍스트, 책, 기사, 보고서, 논문 등 다양한 형태의 1억 단어 이상의 한국어 데이터를 기여하는 파트너사들로 구성된다.

한국어 데이터의 부족 문제 해결은 물론, 데이터 제공자와 모델 제작기업이 상생하는 생태계를 확립할 것으로 기대된다. 업스테이지 측은 “한국문화 정서를 담아낼 수 있는 고품질의 LLM을 개발하고 이를 통해 국내 생성AI 다양한 분야의 애플리케이션에 활용, 인공지능의 발전에 기여할 수 있을 것”이라고 전했다.

현재 20여개 언론사 및 기업, 학계 등 데이터 제공자들과 파트너십을 위한 긴밀한 협의를 진행 중이다. 또 다양한 기업들과 프라이빗 LLM 구축 협의는 물론 한국어 LLM의 발전에 기여할 다양한 분야의 파트너사들과 협력을 추진한다.

1T 클럽에 관심 있는 기관은 업스테이지 홈페이지를 통해 신청하면 된다.

업스테이지는 AI 학습으로 인해 저작권 이슈 등 부작용이 발생하는 문제 해결은 물론, 데이터 제공자와 모델 제작자 모두가 혜택을 볼 수 있도록 운영할 계획이다.

또 1T 클럽에 참여하는 파트너사에게 데이터 제공량에 비례해 API 사용료를 할인해주고, LLM의 API 사업으로 창출될 수익을 공유하는 등 두가지 방식으로 혜택을 제공한다.

김성훈 업스테이지의 대표는 “LLM은 오늘날 생성형 인공지능의 핵심 기술로, 국내 다양한 업계의 기업들도 고성능의 프라이빗 LLM을 자유롭게 활용할 수 있도록 생태계를 만드는 것이 중요하다”며 “1T 클럽을 통해 데이터 제공자들의 권익을 지키고 이를 바탕으로 한국문화 정서를 담아낼 수 있는 LLM을 개발, 국내 모든 기업이 AI발전의 수혜를 볼 수 있도록 최선을 다 할 것”이라고 말했다.

+1
0
+1
0
+1
0
+1
0
+1
0