[SCOOP? STORY!] 가상비서 현주소

스마트폰에 탑재돼 있는 ‘가상비서’는 삶 속에서 손쉽게 만날 수 있는 인공지능(AI) 기술입니다. 말만으로 여러가지 정보를 얻거나 명령을 내릴 수 있다는 게 장점입니다. 그런데, 굉장히 편리한 기술임에도 이를 쓰는 소비자는 많지 않습니다. 이 비서에 무슨 문제가 있는 걸까요? 더스쿠프(The SCOOP)가 가상비서의 현주소를 살펴봤습니다.

가상비서는 소비자로부터 “말을 잘 알아듣지 못한다”며 외면을 받아 왔다.[사진=뉴시스]
가상비서는 소비자로부터 “말을 잘 알아듣지 못한다”며 외면을 받아 왔다.[사진=뉴시스]

“○○야, 오늘 날씨는 어때?” 스마트폰을 쓰는 사람이라면 한번쯤 ‘가상비서’를 불러보곤 합니다. 가상비서는 스마트폰·스마트 스피커 등에 내장된 인공지능(AI)을 말합니다. 음성명령을 인식해 이용자에게 여러 정보를 제공하는 역할을 합니다.

8년 전만 해도 아이폰에 탑재된 애플의 ‘시리’가 유일했는데, 최근엔 종류도 꽤 다양해졌습니다. 안드로이드 운영체제를 기반으로 한 전자기기엔 ‘구글 어시스턴트’가 있고, 아마존은 쇼핑을 돕는 ‘알렉사’를 운영하고 있습니다. 국내에도 ‘빅스비(삼성)’ ‘기가지니(KT)’ ‘누구(SK텔레콤)’ ‘웨이브(네이버)’ 등 가상비서가 넘칩니다.

시장조사업체 에디슨 리서치에 따르면 가상비서를 탑재한 ‘스마트 스피커’의 미국 이용자는 2017년 11월 6670만명에서 2018년 11월 1억1850만명으로 1년 새 77.6% 증가했습니다. 가트너는 2017년 7억 달러(약 8000억원)를 살짝 넘겼던 가상비서 스피커 시장이 2021년엔 35억2000만 달러(약 4조761억원)까지 확대될 것으로 내다봤습니다.

국내 소비자들도 가상비서에 긍정적인 반응을 보입니다. 국내 성인남녀 1000명에게 ‘가상비서의 이미지’를 물어본 결과, ‘혁신적인(43.9%·복수응답)’ ‘똑똑한(36.3%)’ ‘유용한(35.4%)’ 등의 답변이 이어졌습니다(트렌드모니터·2018년 2월 기준).

그렇다면 소비자들은 가상비서를 어떤 용도로 쓰고 있을까요? 음성인식 정보사이트인 ‘보이스봇’은 스마트 스피커를 매일 쓰는 이용자의 38.2%가 ‘음악재생’에 쓰고 있다고 밝혔습니다(2019년 2월). 그 뒤는 ‘질문하기(36.9%)’ ‘날씨 확인(35.6%)’ ‘알람 설정(23.5%)’ 등의 순이었죠. 고도의 AI 기술을 기반으로 한 것 치고는 가상비서가 단순한 용도로만 쓰이고 있습니다. 그 때문인지 가상비서 이용률도 저조한 편입니다.

잡무만 하는 가상비서

이런 현상은 현재 가상비서가 음성을 인식하는 수준과 무관하지 않습니다. 인식률이 현저하게 낮은 건 아니지만 소비자는 가상비서의 말귀가 어둡다고 생각합니다. 업계의 한 관계자의 말을 들어보시죠. “음성명령은 말하는 도중 수정이 불가능한 데다 중간에 말이 끊기면 가상비서가 제대로 인식하지 못한다. 그렇기에 소비자는 음성명령을 내릴 때 상당한 노력을 기울인다. 긴 문장을 말했는데 가상비서가 알아듣지 못한다면 소비자는 짜증이 날 수밖에 없다.”

이렇다 보니 이용자들은 가상비서를 적극적으로 이용하기가 어렵습니다. 조금이라도 복잡한 명령을 내리면 가상비서가 엉뚱한 답변을 내놓기 일쑤이기 때문이죠. 가상비서의 대화가 텍스트에 한정돼 있다는 점도 한계점으로 꼽힙니다. 대부분의 가상비서는 질문자가 원하는 답변을 문장으로 띄우고 읽어주는 방식으로 작동합니다. 이용자에게 유용할 만한 링크를 제공하거나 관련 앱을 실행하기도 하죠. 하지만 이 정도로는 좀 더 복잡한 작업을 수행하기 어렵습니다.

구글이 지난 5월 10일 ‘인터렉티브 캔버스’를 공개한 건 이런 한계를 뛰어넘으려는 시도로 보입니다. 인터렉티브 캔버스는 구글 어시스턴트가 이용자의 명령을 인식한 뒤 답변을 시각화하는 기술입니다. 쉽게 말해, 이용자가 날씨를 물어보면 관련 데이터를 그래프로 가공해 애니메이션처럼 보여주거나 뉴스영상 등의 자료를 띄워주는 방식입니다. 영화 ‘아이언맨’에서 주인공에게 다양한 시각정보를 제공하는 AI 비서 ‘자비스’와 비슷하다고 보면 됩니다.

물론 구글은 가상비서의 음성 인식률을 높이는 데에도 힘을 쏟고 있습니다. ‘딥러닝’ 기술을 가상비서에 활용하는 건 이를 잘 보여주는 사례죠. 사용자의 질문을 문장 자체가 아니라 맥락으로 알아듣는 건데, 그러면 가상비서가 엉뚱한 답을 내놓을 확률을 낮출 수 있습니다.

가상비서의 용량을 줄인 것도 같은 맥락입니다. 구글은 100GB에 달했던 AI기능이 기술 혁신을 통해 0.5GB 수준으로 줄어들었다고 밝혔습니다. 온라인 서버를 거치지 않고 기기 속에서 가상비서가 곧바로 작동할 수 있게 됐다는 얘기입니다. 그 결과, 구글 어시스턴트는 기존보다 10배 빠른 작업속도를 갖추게 됐습니다.

가상비서가 풀어야 할 숙제들

그럼에도 가상비서가 해결해야 할 숙제는 많습니다. 개인정보를 어떻게 보호하냐는 중요한 과제입니다. 스마트 스피커·스마트폰 등 가상비서를 갖춘 기기는 항상 켜져 있습니다. 언제든지 이용자의 질문에 답하기 위해서죠. 기기 소유자 외의 제3자가 소유자의 개인 정보를 요구할 경우 이를 방어하기 어렵습니다. 가상비서가 소유자의 고유 음성을 판독하는 기술이 개발 중이지만 아직 완벽한 수준은 아닙니다.

가상비서가 해킹에 취약하다는 지적도 짚어봐야 합니다. 2017년 중국 제장대 연구팀은 사람 귀에 들리지 않는 초음파로 가상비서를 해킹할 수 있다는 연구 결과를 공개했습니다. 이들이 유튜브에 올린 동영상에는 초음파로 PC·스마트폰의 가상비서에게 명령해 특정 웹사이트를 열거나 차량 내비게이션의 목적지도 바꾸는 과정이 담겨 있었습니다. “가상비서 기술을 적극적으로 쓰기엔 보안 수준이 걸음마 단계에 머물러 있다”는 지적을 피하기 어려운 이유입니다. 가상비서, 진짜 비서가 되기엔 아직 갈 길이 멉니다.
이혁기 더스쿠프 IT전문기자 lhk@thescoop.co.kr

저작권자 © 더스쿠프 무단전재 및 재배포 금지

개의 댓글

0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400

내 댓글 모음