[인터뷰] 업스테이지 “성능·실용성 모두 갖춘 LLM 개발이 목표”

184

박찬준 업스테이지 LLM팀 수석 연구원 인터뷰

박찬준 업스테이지 LLM팀 수석 연구원이 지난 17일 데일리안과 인터뷰를 하고 있다. ⓒ업스테이지 박찬준 업스테이지 LLM팀 수석 연구원이 지난 17일 데일리안과 인터뷰를 하고 있다. ⓒ업스테이지

“특정 목적에 맞는 LLM(거대언어모델)만큼은 GPT-4, 최근에 나온 GPT-4o보다 더 우수하게 만드는 것이 목표입니다.”

박찬준 업스테이지 LLM팀 수석 연구원의 말이다. 업스테이지는 LLM계 올림픽으로 불리는 ‘오픈 LLM 리더보드’에서 솔라로 오픈AI의 GPT-3.5를 제치고 세계 1등을 거머쥔 국내 대표 AI 스타트업이다. 그러나 그 이후에 나온 LLM까지 따라잡기에 현실의 벽은 꽤 높았다. 박찬준 연구원은 지난 17일 진행된 데일리안과의 인터뷰에서 “냉정하게 말하자면 최근에 나온GPT-4, GPT-4o보다 솔라가 더 성능이 좋다고 말하기 어렵다”고 했다.

박 연구원은 “하지만 모두가 처음에 놀란 그 기술을 국내 스타트업이 빠르게 팔로우했다는 것 자체가 유의미하다”며 “글로벌 LLM 시장에서 앞서있는 오픈AI는 임베딩(자연어를 기계가 이해할 수 있도록 변환) API(응용 프로그램 인터페이스), 펑션콜(외부 API를 호출해 새로운 기능으로 확장) API 등을 서비스하고 있는데 우리는 이것들을 기본적으로 다 가지고 있다”고 말했다. 그는 “즉 글로벌 레벨의 기업들 대비 우리 기술 수준이 조금 떨어질 수 있으나 구색은 다 갖춘 상태”라며 “그들을 따라가기 위해 계속 노력하고 있다”고 덧붙였다.

업스테이지는 패스트 팔로워 역할에 안주하지 않고 B2B(기업간거래) 사업을 빠르게 넓혀갔다. 기술 개발도 중요하지만 이윤을 창출해야 하는 기업인만큼 그 기술로 돈을 버는 일도 중요하다고 생각했기 때문이다. 박 연구원은 “축구로 따지면 프리미어리그에 입성하기 위해 노력하는 동시에 LLM으로 수익을 내려고 하고 있다 ”며 “특정 목적에 맞는 LLM은 글로벌 레벨의 LLM보다 좋게 만드는 것이 목표”라고 강조했다.

B2B 사업은 작년 국내에서 먼저 시작했다. 대표적인 사례는 커넥트웨이브의 가격 비교 서비스 ‘다나와’에 적용한 두 가지 버전의 LLM이다. 하나는 이용자들이 쓴 상품 리뷰들을, 다른 하나는 한 상품의 수많은 정보들 중 유의미한 정보들을 추출해 한눈에 보여준다. 박 연구원은 “업스테이지 기술력에 매우 만족한다고 말할 정도로 고객 반응이 좋았다”며 “기술력으로 입소문이 나면서 현재는 국내에서 LLM으로 가장 많은 돈을 벌고 있는 기업이 됐을 것”이라고 자부했다. 업스테이지는 올해 1분기 LLM으로만 100억원 이상을 벌었다는 설명이다.

GPT-4보다 수학 문제에 더 능한 LLM도 만들었다. 박 연구원은 “콴다, KT와 함께 개발한 수학 문제를 푸는 ‘매스 LLM’은 세계 최고 성능을 보였다”며 “오픈 LLM 리더보드에 수학 과목을 테스트하는 시험지가 2개 있는데 이 시험에서 GPT-4뿐 아니라 메타의 ‘라마’와 비교했을 때도 더 높은 성능을 보였다”고 덧붙였다.

박 연구원은 “B2B 사업에서는 고객이 겪는 허들이 무엇인지, 또 그들이 원하는 구체적인 유스 케이스(Use case)가 무엇인지 찾는 것이 중요하다”며 “특정 목적에 맞는 LLM을 개발하고 그것만큼은 GPT-4, GPT-4o보다 더 좋게 만드는 것이 LLM팀의 목표”라고 강조했다.

업스테이지는 최근 한국에 이어 미국에서도 B2B 사업을 시작했다. 이를 위해 설립한 미국 법인이 전초기지다. 박 연구원은 “미국에서 솔라 기반으로 한 여러 해커톤을 열면서 (솔라를) 많이 알리고 있다”며 “C레벨들이 직접 현지에서 뛰고 있다. 지금 구체화되고 있는 협업 계획이 있어서 곧 공개할 수 있을 것 같다”고 자신있게 말했다.

업스테이지의 궁극적 목표는 글로벌 진출이다. 일본어, 태국어 등 아시아권 데이터 구축 위해 최근 글로벌 데이터 구축 기업 플리토와 업무협약(MOU)을 맺기도 했다. 박 연구원은 “한국어를 제일 잘하는 LLM을 만들기보다는 영어를 정말 잘하는 것이 최우선 과제”라며 “동시에 한국어와 일본어를 비롯한 아시아권 언어까지 언어 확장도 고려하고 있다”고 밝혔다.

+1
0
+1
0
+1
0
+1
0
+1
0