[IBM 通通 테크라이프] AI, 웃음의 목적까지 알아챘네
[IBM 通通 테크라이프] AI, 웃음의 목적까지 알아챘네
  • 김다린 기자
  • 호수 348
  • 승인 2019.07.25 08:26
  • 댓글 0
이 기사를 공유합니다

웃음지문의 비밀

웃음의 종류는 각양각색이다. 행복해서 웃는 ‘진짜 웃음’이 있는가 하면, 슬프고 허탈한 일을 겪을 때 짓는 ‘가짜 웃음’도 있다. 우리는 때때로 이 둘을 구분하지 못해 곤경에 빠질 때가 있다. 인간도 쉽지 않은 일인데, AI는 해냈다. IBM 연구팀이 개발한 ‘웃음지문’ 덕분이다. 더스쿠프(The SCOOP)와 IBM의 通通 테크라이프, 이번엔 ‘웃음지문’ 편이다. 

인간의 복잡다단한 감정은 AI가 파악하기 쉽지 않은 영역이다.[일러스트=게티이미지뱅크]
인간의 복잡다단한 감정은 AI가 파악하기 쉽지 않은 영역이다.[일러스트=게티이미지뱅크]

인공지능(AI) 기술이 우리 삶 곳곳에 자리잡아가고 있다. 흔히 사용하는 웹 검색에서부터 번역, 얼굴 인식, 영상 분석 등 AI를 활용하지 않는 산업을 찾기 어려울 정도다. AI 기술을 접목한 음성비서나 스피커도 흔하다. 하지만 AI로 인해 인류의 삶이 획기적으로 바뀌었는지는 의문이다. 2016년 AI 알파고가 이세돌 9단을 꺾으면서 놀라운 기술의 진보를 보여줬지만, “인간의 능력을 뛰어넘었다”는 건 과도한 해석이다.

복잡한 수식을 계산하고 방대한 양의 데이터를 다루는 건 AI만의 장점이다. 인간의 뇌를 흉내내 구조를 만들고, 여기에 방대한 양의 데이터를 넣은 뒤 스스로 법칙을 깨우치도록 하는 ‘머신러닝’ 방식을 따른 덕분이다.

그럼에도 여전히 알파고는 ‘바둑을 잘 두는 AI’일 뿐, 그 이상의 일을 해낼 순 없다. 아직 AI엔 한계가 많다. 특히 감정, 판단력, 직관 등 인간 고유의 영역은 AI가 넘볼 수 없는 영역으로 꼽힌다. 인간 스스로도 뇌에 이런 기능이 어떻게 탑재돼 있고 감정을 어떻게 발현하는지는 밝히지 못했기 때문이다.

2014년 개봉한 영화 ‘허(Her)’가 ‘영화 속 얘기’로만 치부되는 것도 이 때문이다. 이 영화는 감성 인식 기능의 인공지능 운영체제(OS) 사만다와 주인공이 사랑에 빠지는 과정을 소재로 했다. 주인공은 공감이 필요할 때 자신의 얘기에 귀 기울여주고, 위로가 필요한 시점에 따뜻한 말을 건네는 사만다의 매력에 흠뻑 빠진다.

하지만 현실의 AI는 인간의 복잡다단한 감정까지 배려하진 못한다. 정해진 문법과 단어 등 규칙이 있는 언어를 해석하는 건 쉽지만, 인간의 감정은 규칙이 뚜렷하지 않아서다. 아무리 똑똑한 AI더라도 넘보기 어려운 인간 고유의 영역인 셈이다.

최근 IBM 연구팀은 이런 상식을 깨는 자료를 ‘2019 국제전기전자공학회 신호처리국제학술대회’에서 발표했다. 대화 속에서 웃음의 성격을 판별할 수 있는 AI 기술이다. 연구팀이 웃음 분석을 시도한 건 그간 ‘언어 분석’에만 매진한 AI 플랫폼의 한계가 뚜렷했기 때문이다. 인간의 비언어적 의사소통을 파악하진 못하는 기술은 사용자의 의중과 진심을 헤아리는 게 쉽지 않았다. 이 때문에 연구도 ‘대화 속 웃음’에 담긴 목적을 파악하는 데 중점을 뒀다.

웃음이 뭔가. 입 주위와 얼굴의 근육 몇 부분을 움직이고, 일정한 소리를 내는 게 전부다. 하지만 그 안에 담긴 의미를 판별하는 건 인간에게도 쉽지 않은 일이다. 보통의 사람들은 즐거운 유머를 듣고 웃는다. 이밖에 남을 멸시하는 웃음도 있고, 비웃음도 있다. 지나치게 스트레스를 받을 때 헛웃음을 짓기도 한다.

감정 ‛인간 고유의 영역’

이렇게 넓은 웃음의 세계를 AI는 어떻게 판별할 수 있었을까. 과정을 살펴보자. 
연구팀은 먼저 음성인식 기술을 고도화하는 데 집중했다. 사람의 말소리와 웃음소리를 구별하기 위해서다. 그 결과, 연구팀의 AI 기술이 대화 속 웃음을 골라내기 시작했다. 더 나아가 웃음의 높낮이나 억양, 속도, 크기, 떨림, 지속시간 등으로 웃음의 종류도 구분했다.

또한 혼자 있는 경우와 여럿이서 함께 웃는 경우 등 시나리오에 따라 웃음의 기능을 분석했다. 이런 방식으로 1200명 이상의 지원자로부터 웃음과 관련된 에피소드가 담긴 녹취록을 수집했다.

이렇게 모인 자료 속에서 AI는 총 4가지 범주의 웃음 속에 공통점이 있다는 걸 찾아냈다. ‘진실한 행복의 웃음’ ‘슬픔의 웃음’ ‘활기찬 웃음’ ‘빈정거리는 웃음’ 등이다. 연구팀은 이 결과에 ‘웃음 지문’이라는 이름을 붙였다. 웃음소리만 듣고도 그 안에 담긴 진의를 파악할 수 있기 때문이다.

가령 진짜 행복해서 웃는 웃음엔 규칙적인 파동이 있었다. 또한 나머지 웃음보다 상대적으로 길고 소리도 컸다. 활기찬 웃음에선 점차 상승곡선을 그리는 파동을 목격할 수 있었다. 반면 슬픈 웃음엔 짧고 불규칙한 파동이 드러났다. 빈정거리면서 웃을 땐 음절이 짧고 소리도 크지 않았다.

IBM 연구팀은 웃음지문이 효과적으로 작동하는지도 실험했다. 그 결과, 음성으로만 사용자의 의도를 파악할 때보다 14% 이상 정확도가 상승했다.

인간의 감정까지 정복한 AI의 등장이 섬뜩하게 느껴질 수도 있다. AI와 사랑에 빠지는 게 더는 허황되거나 막연한 일이 아닐 수 있어서다.

하지만 이 연구의 목적은 단순히 웃음을 파악하는 AI를 개발하기 위함이 아니다. 행복, 슬픔, 정신적 고통 등의 감정이 인간에게 작용하는 이해를 넓힐 수 있다는 게 연구진의 설명이다. 특히 웃음은 치료요법으로 쓰일 만큼 건강과 밀접한 관련이 있다. 웃음이 스트레스를 완화하고 혈압을 안정시키는 효과가 있어서다.

웃는 것은 가장 쉬운 유산소운동이기도 하다. 웃기 시작하면 실제 우리 몸의 231가지 근육이 움직인다. 진통제 역할을 하는 엔도르핀, 엔케팔린, 옥시토신 등과 같은 신경전달물질이 분비되기도 한다

AI 기술로 웃음을 이해할 수 있게 되면, 의사도 진단하지 못한 마음의 병을 진단할 수 있을지도 모른다. AI의 활용 방안은 이처럼 무궁무진하다.  
김다린 더스쿠프 기자 quill@thescoop.co.kr
도움말 | 한국IBM 소셜 담당팀 blog.naver.com/ibm_korea


관련기사

  • 서울특별시 영등포구 경인로 775 에이스하이테크시티 1동 12층 1202호
  • 대표전화 : 02-2285-6101
  • 팩스 : 02-2285-6102
  • 법인명 : 주식회사 더스쿠프
  • 제호 : 더스쿠프
  • 장기간행물·등록번호 : 서울 아 02110 / 서울 다 10587
  • 등록일 : 2012-05-09 / 2012-05-08
  • 발행일 : 2012-07-06
  • 발행인·대표이사 : 이남석
  • 편집인 : 양재찬
  • 편집장 : 이윤찬
  • 청소년보호책임자 : 김병중
  • Copyright © 2019 더스쿠프. All rights reserved. mail to webmaster@thescoop.co.kr ND소프트