카이스트, ‘스스로 상황 인식하는’ 스마트 스피커 개발

93
사용자에게 먼저 말을 걸어 정신건강 자가 추적을 돕는 작동 방식. 사용자의 주변 상황을 파악하여 사용자가 대화가 가능하다고 예측되는 시점에 “지금 당신의 마음 건강은 어떤가요?”와 같이 대화의 시작을 알리는 문장으로 말을 건다. / 출처 : 카이스트 연구뉴스
사용자에게 먼저 말을 걸어 정신건강 자가 추적을 돕는 작동 방식. 사용자의 주변 상황을 파악하여 사용자가 대화가 가능하다고 예측되는 시점에 “지금 당신의 마음 건강은 어떤가요?”와 같이 대화의 시작을 알리는 문장으로 말을 건다. / 출처 : 카이스트 연구뉴스

카이스트 전산학부 이의진 교수 연구팀이 1인 가구 정신건강 관리를 위한 ‘상황 인식 기반 멀티모달 스마트 스피커 시스템(이하 멀티모달 스피커)’을 개발했다고 24일(화) 밝혔다.

멀티모달 스피커는 사용자의 주변 환경을 실시간으로 파악해, 최적의 시점에 정신건강에 관련된 질문을 하도록 설계됐다. 실제 1인 가구에 사용성 테스트를 진행한 결과, 기존 스마트 스피커가 던지는 무작위 설문에 비해 높은 응답률을 달성하는 것까지 확인했다. 

이를 통해 1인 가구의 정신건강 관리를 도울 수 있는 ‘인공지능 에이전트’의 새로운 가능성을 열 수 있을 것으로 기대된다.

늘어나는 1인 가구, 정신건강 문제 우려

2023년 기준으로, 우리나라 1인 가구의 비율은 약 30% 정도인 것으로 알려져 있다. 고령화 및 결혼 및 이혼율, 출산율 감소 등 여러 사회적 요인이 복합적으로 작용한 결과다. 

1인 가구는 기본적으로 자신의 일상 및 생활방식을 자유롭게 결정하고 시간을 활용할 수 있다는 장점이 있다. 집에 있을 때는 아무런 방해 없이 혼자서 편안하게 쉬고, 밖에서는 다양한 사회적 관계를 형성할 수 있는 기회를 얻을 수 있다.

반면, 외로움이나 고립감을 느끼기 쉽다는 단점이 있다. OECD 연구에 따르면, 1인 가구의 우울증 및 불안장애 비율이 상대적으로 높다는 결과가 있다. 서울시에서 실시한 1인 가구 실태조사에서도, 1인 가구의 60% 이상이 외로움과 사회적 고립감을 느끼는 것으로 나타났다.

기계는 눈치를 보지 않는다

1인 가구의 정신건강 관리에 초점을 맞춘 스마트 스피커는 새로운 개념이 아니다. 스마트 스피커 뿐만 아니라 인공지능 비서를 표방한 모바일 애플리케이션도 여럿 존재한다. 이들이 1인 가구의 정서적 지원에 어느 정도 효과가 있다는 연구 결과는 있었으나, 그에 대한 한계도 분명 존재했다.

특히, 기존 스마트 스피커를 활용한 정신건강 자가추적 사례를 연구한 결과, 무작위 설문을 할 경우 오히려 사용자로 하여금 스트레스, 짜증을 유발하는 경향이 있었다. 기계는 사용자의 기분이 어떤지를 알 수 없기 때문에, 불시의 타이밍에 무작위 질문을 던지는 것이 일반적이다. 

하지만 기분이 침울하거나 극도의 스트레스를 받고 있을 때, 스마트 스피커가 던진 질문에 정상적으로 응답하는 사람은 많지 않을 것이다. 이 때문에 연구 목적으로 수집한 응답 결과에 다소 편향이 발생함으로써 연구에 걸림돌이 되곤 했다.

상황 인식 기반 멀티모달 스마트 스피커 시스템 개요도 / 출처 : 카이스트 연구뉴스
상황 인식 기반 멀티모달 스마트 스피커 시스템 개요도 / 출처 : 카이스트 연구뉴스

복합 데이터 수집을 통한 ‘상황 파악’ 기능

이의진 교수 연구팀은 이러한 문제 해결을 위해 스마트 스피커에 ‘멀티모달 센서(Multi-modal sensor)’를 장착했다. 멀티 모달 센서는 다양한 종류의 데이터를 동시에 수집할 수 있는 센서를 말한다. 수집한 데이터를 종합해 사용자의 주변 환경 변화를 감지하고, 이를 통해 ‘말 걸기 좋은 시점’을 선정해 정신건강 자가추적 설문을 요청한다. 즉, ‘상황을 인식하고 판단해 적합한 타이밍에 질문을 던지는 것’이 핵심이다.

멀티모달 스피커는 실내 움직임, 조명, 소음, 이산화탄소 등 다양한 센서 데이터를 종합적으로 수집·분석한다. 이를 통해 사용자가 실내에 있는지, 움직이고 있는지 등을 감지한 다음, 사용자가 응답하기 적합하다고 판단되는 시점에 질문을 던짐으로써 응답 효율을 높였다.

응답 방식 또한 음성 명령 뿐만 아니라 터치 스크린을 통한 입력도 가능하도록 해, 상호작용의 폭을 넓혔다. 사용자는 자신의 상황에 맞는 최적의 인터페이스를 선택해 정신건강 자가 추적을 수행할 수 있다.

상황 인식 기반 멀티모달 스마트 스피커 시스템 프로토타입 / 출처 : 카이스트 연구뉴스
상황 인식 기반 멀티모달 스마트 스피커 시스템 프로토타입 / 출처 : 카이스트 연구뉴스

UX 평가, ‘터치 입력’ 선호도 높아

멀티 모달 스피커의 사용자 경험(UX)을 평가하기 위해, 연구팀은 1인 가구 20세대를 선정해 스피커를 설치하고 1개월에 걸친 실증 연구를 수행했다. 그 결과로 총 2,201개의 정신건강 설문 응답 데이터셋(data set)을 구축했다.

연구팀은 확보된 데이터셋을 분석하여, 설문 응답 시간, 활동 맥락에 따른 설문 응답 패턴, 음성 입력(VUI)과 터치 입력(GUI)이 각각 어떤 상황에서 선호도가 높은지 등을 파악했다. 분석 결과, 참가자들은 전반적으로 터치 입력을 선호하는 것으로 나타났다. 음성 입력의 편의성이 높음에도 불구하고, 터치 입력이 보다 빠르게 응답할 수 있기 때문인 것으로 나타났다.

연구를 주도한 이의진 교수는 “이번에 개발한 스마트 스피커는 앞으로 수용전념치료 기법을 활용한 인간상담사와 같은 기능의 정신건강 관리 지원 기기로 발전시키고자 한다”라고 이야기했다. 한편, 실내에서 수집한 일상생활 데이터를 AI 모델로 학습시킴으로써, 사용자의 정신건강 상태에 따라 생활 패턴을 예측하는 시스템도 개발할 수 있을 거라고도 말했다. 정신질환의 조기 발견 및 효율적 관리를 도울 인공지능 에이전트의 혁신 사례가 될 수 있을 것이다.

정신건강 자가 추적을 위한 멀티모달 스마트 스피커 대화 시나리오 / 출처 : 카이스트 연구뉴스
정신건강 자가 추적을 위한 멀티모달 스마트 스피커 대화 시나리오 / 출처 : 카이스트 연구뉴스
+1
0
+1
0
+1
0
+1
0
+1
0