MIT “일관성 없는 AI, 가치관·선호도 없어…인격 생길 가능성 없어”

2025.04.16

241

인공지능(AI)의 답변은 일관성이 없으며, 이에 따라 가치관이나 선호도 있을 수 없다는 연구 결과가 나왔다. 당연한 말이지만, 이는 앞으로도 대형언어모델(LLM)은 인격과 같은 것을 가질 수 없다는 근거로 강조됐다.

MIT 컴퓨터과학 및 인공지능 연구소(CSAIL)는 8일(현지시간) 온라인 아카이브를 통해 ‘재현이 아닌 무작위(Randomness, Not Representation): LLM의 문화적 평가의 신뢰성 부족‘이라는 논문을 게재했다.

연구진은 AI 시스템을 ‘문화적으로 정렬(alignment)’하는 것, 즉 모델이 인간이 원하는 바람직한 방식으로 동작하도록 하는 것이 흔히 생각하는 것보다 더 어려울 수 있다고 지적했다. 또 “AI는 안정성, 외삽 가능성, 그리고 조종 가능성에 대한 많은 가정을 따르지 않는다는 것”이라고 밝혔다.

이는 AI가 특정한 조건에는 일정한 원칙에 따라 움직여야 하지만, 그렇지 않다는 것을 말하는 것이다.

연구진은 ‘라마 3.1 405B’와 ‘클로드 3.5 소네트’, ‘GPT-4o’ ‘제미나이 2.0 플래시’ ‘미스트랄 라지’ 등 가장 대중적인 모델을 분석했다. AI 모델이 얼마나 강한 견해와 가치관을 보이는지 살펴봤으며, 이런 점을 쉽게 수정할 수 있는지도 조사했다.

그 결과, 어떤 모델도 일관성 있는 선호도를 보이지 못했다고 밝혔다. 특히, 질문의 표현과 방식에 따라 번번이 매우 다른 답을 출력했다는 결론이다.

연구진은 이것이 “AI 모델이 매우 일관성이 없고 불안정한 증거”라고 지적했다. 나아가 근본적으로 인간과 같은 선호도를 내면화할 수 없다는 것을 보여주는 설득력 있는 증거라고 주장했다.

“이번 연구를 통해 깨달은 것은 AI 모델이 안정적이고 일관된 신념과 선호를 가진 체계가 아니라는 것”이라며 “대신, AI는 되는대로 말을 막던지는 모방자일 뿐”이라고 밝혔다.

이처럼 이는 최근 들어 AI 챗봇을 인격화하는 경향이 강해지는 데 대한 반박이라는 논리다.

이에 대해 마이크 쿡 킹스칼리지 런던 AI 전문 연구원은 테크크런치와의 인터뷰에서 “모델은 가치관 변화에 ‘반대’할 수 없다. 단지, 우리가 시스템에 투사하는 것을 받아들일 뿐”이라고 지적했다.

따라서 현재의 AI 시스템이 언젠가는 인격을 가지게 되는 일은 없을 거라는 주장이다. “AI가 자신만의 목표를 갖거나 가치를 획득할 수 있다는 것은 오해나 과장일 뿐”이라고 설명했다.

임대준 기자 ydj@aitimes.com

MIT “일관성 없는 AI, 가치관·선호도 없어…인격 생길 가능성 없어”

테크 랭킹 인기글

테크 최신 인기글

“할머니, 오늘은 좀 어떠세요?”…日 노인들의 ‘말벗’ 된 네이버 AI

버드 스트라이크 막으려 미군이 만든 로봇

방통위, 시청자가 만든 드라마·다큐 등 방송영상 작품 공개 모집

AI, 인간 심리까지 예측한다…獨·美 ‘센타우르’ 모델 발표

지구 생명체 기원 밝힐 증거 잡았다?

“팀장님은 차 세우러 가셨나요?”…편견 깨고 현장 누빈 ‘영업출신 女 CEO’

TOP

넷플릭스 신작 공개 예정작 최신 영화 6편

일출랜드 | 미천굴을 시작으로 다양한 체험이 가득한 서귀포 놀거리

믿고 가는 추천으로 유명한 최자 맛집 BEST5

복날보양식 간단한 춘천 닭갈비레시피 더미식요리양념

재혼 후 돈 때문에 문제가 생겼습니다

인기글

재혼 후 돈 때문에 문제가 생겼습니다

초코파이로 알아보는 아재 테스트

유명산자연휴양림 | 서울 근교 캠핑&차박도 가능한 가평 여행지 추천

자존감 낮은 티가 심하게 나는 행동 4가지

가성비좋은 삼성동맛집 민속밀면 강남점

인기글

출근 첫 날 딸기를 다 쏟았을 때 듣는 말

[요즘뜨는] 아직 떠나지 못한 자를 위한 짧고 굵은 여름휴가 추천지

이병헌·손예진의 ‘어쩔수가없다’ 9월24일 개봉·15세 이상 관람가

추성훈도 왔다갔네…305% 검색량 폭증한 중국 이 도시의 정체