카카오, AI 가드레일 모델 ‘카나나 세이프가드’ 3종 오픈소스 공개

482
카카오의 인공지능(AI) 가드레일 모델 '카나나 세이프가드'(Kanana Safeguard) (카카오 제공)
카카오의 인공지능(AI) 가드레일 모델 ‘카나나 세이프가드'(Kanana Safeguard) (카카오 제공)

카카오가 안전하고 신뢰할 수 있는 생성형 AI 환경 조성에 나선다. 카카오는 AI 서비스의 안전성과 신뢰성을 검증할 수 있는 AI 가드레일 모델 ‘카나나 세이프가드(Kanana Safeguard)’를 개발하고, 국내 기업 최초로 총 3종의 모델을 오픈소스로 공개한다고 밝혔다.

최근 생성형 AI 서비스가 빠르게 확산되면서 유해 콘텐츠에 대한 사회적 우려가 커지고 있다. 이에 카카오는 기술적·제도적 대응책으로 AI 가드레일 시스템의 필요성을 인식, 카나나 세이프가드 모델을 개발했다. 주요 글로벌 빅테크 기업들도 생성형 AI의 위험 요소를 감지하는 모델을 운영 중이다.

카나나 세이프가드는 카카오가 자체 개발한 언어모델 ‘카나나’를 기반으로 하며, 한국어와 한국 문화를 반영한 데이터셋을 활용해 한국어에 특화된 높은 성능을 보유하고 있다. F1 스코어 평가에서 한국어 성능이 글로벌 모델을 뛰어넘는 성과를 기록했다.

이번에 공개된 3종 모델은 각각의 위험 유형별 탐지가 가능하다. 카나나 세이프가드는 증오, 괴롭힘, 성적 콘텐츠 등 유해성을 감지하고, ‘카나나 세이프가드-시렌(Siren)’은 개인정보와 지식재산권 등 법적 위험 요청을 탐지한다. ‘카나나 세이프가드-프롬트(Prompt)’는 AI 악용 시도를 탐지하며, 모두 허깅페이스(Hugging Face)에서 다운로드할 수 있다.

카카오는 안전한 AI 생태계 구축에 기여하고자 이 모델들에 아파치2.0(Apache 2.0) 라이선스를 적용해 상업적 이용, 수정, 재배포가 자유롭도록 했다. 앞으로 지속적인 업데이트로 모델 고도화를 추진할 계획이다.

+1
0
+1
0
+1
0
+1
0
+1
0

테크 랭킹 인기글