얼마전 집에 인터넷 결합 상품을 변경하면서 음성인식 기능이 들어간 스피커를 설치했다. 기존에 100M 라인을 쓰다가 UHD TV를 구매하면서 셋톱을 UHD셋톱으로 변경하다보니 이제는 기가라인을 써야 UHD셋톱이 제공된다고 해서 비용이 비싸지만 울며 겨자먹기로 설치를 한 것이었다.

그런데, 사용을 해보니 생각보다 재미있고, 예전에 비해서 음성인식기술이 많이 좋아졌다는 것을 느낄 수 있었다. 기대가 적어서 였을 수도 있다. 주말에 집에 친척 아이들이 여럿 몰려왔는데, 음성인식이 가능한 스피커 시연에 너도 나도 TV를 켜라, 꺼라, 음악을 틀어라, 만화를 찾아달라며 음성인식 스피커를 괴롭혔다. 최신 기술이 편하고, 신기하기도 하고, 사물에 명령을 내리고, 기기가 명령을 수행한다는 점에서 분면 매력이 있는 거 같다. 그래서 음성인식기술에 대해 좀 더 알아보고, 연구하고자 조사를 해 본 것이다.

음성인식기술 이란 컴퓨터가 마이크와 같은 소리 센서를 통해 얻은 음향학적 신호(acoustic speech signal)를 단어나 문장으로 변환시키는 기술을 의미한다.

음성인식을 위해 음향 신호를 추출한 후 잡음을 제거하는 작업을 하게 되고, 이후 음성 신호의 특징을 추출하여 음성모델 데이터베이스(DB)와 비교하는 방식으로 음성인식을 하게 된다. 음성인식기술 역시 센싱과 데이터 분석 기술이 결합하여 있기는 하지만, 측정하고 분석해야 하는 데이터가 음성 데이터 하나라는 점에서 보다 손쉽고 정확하게 사람의 의도를 파악하는 방법으로 알려졌다.

음성인식기술을 바탕으로 한 다양한 음성인식 서비스들은 2000년대 후반에 본격적으로 소개되기 시작했다. 대표적인 것이 2011년에 출시된 애플의 음성 기반 개인비서 서비스인 ‘시리(Siri)’다. 시리는 아이폰 사용자의 음성명령을 바탕으로 검색은 물론, 일정관리, 전화 걸기, 메모, 음악 재생 등 다양한 생활편의 서비스를 제공하는 비서 서비스다. 애플이 시리를 출시한 이후, 구글은 ‘구글 나우(Google Now)’, 마이크로소프트는 ‘코타나(Cortana)’와 같은 음성인식 기반의 개인비서 서비스를 출시했으며, 일본의 NTT도코모는 ‘샤베테콘쉐루(しゃべってコンシェル)’라는 외국어 통역 서비스를 출시하기도 했다.

애플의 '시리(Siri)'는 아이폰에서 쉽게 체험할 수 있고, 실제로 많은 사용자들이 편리하게 이용하는 것을 볼 수 있다.

삼성전자나 LG전자 같은 스마트폰 제조사들도 ‘S보이스’나 ‘Q보이스’ 같은 서비스를 출시하기도 했다. 하지만, 이러한 음성인식 서비스들은 서비스라기보다는 다양한 응용 서비스를 위한 음성 인터페이스 역할을 했다는 것이 더 정확할 것이다. 최근에는 아마존이 ‘대쉬(Dash)’나 ‘에코(Echo)’와 같은 음성인식 기반의 서비스 장치(Service Device)를 출시하고 있으며, 구글의 ‘온허브(OnHub)’처럼 음성인식 기반의 스마트홈 허브 장치들도 다양하게 출시되고 있다.

삼성의 'S보이스' 나 구글의 경우도 안드로이드 폰에서 음성인식을 직접 체험해 볼 수 있다. 적용 분야도 점점 다양해 지고 있거, 홈 IOT를 시작으로 자동차에도 이미 오래전부터 음성인식이 가능한 내비게이션을 시작으로 이제는 다양한 정보를 수행할 수 있는 신차가 개발되고 있다. 머지 않은 미래를 예측해 보면, 이런 삶이 되지 않을까?

아침이 밝으니 음악으로 알람이 울리고, 커튼이 열린다. 커피포트가 가열을 시작하고, 환기를 위해 위쪽 창문이 살짝 열린다. 졸린 눈을 비비며 밤사이 문자나 전화가 없는지 물어본다. 중요한 메시지를 읽어달라고 한다. 중요한 일정이라 황급히 출근 준비를 하고, 가볍게 식사를 하고, 엘리베이터를 3분후에 호출해 달라고 한다. 현관을 나서면서 "외출모드로 설정해줘" 라고 말하자 현관문이 잠기고, 실내 등과 TV가 꺼지고, 가스밸브가 차단된다. 미리 도착한 엘리베이터에 오르고 주차장에 도착하여 차에 다가가 "도어오픈"이라는 말과 동시에 차문이 열리고, 시동이 켜진다. "회사로"라고 말하자 내비게이션이 걸정되고, 세가지의 추천 경로를 안내한다. "시간우선"을 선택하니 가장 빠른 시간에 도착할 수 있는 길로 안내를 시작한다. 몸이 피곤해서 자율 주행 모드로 맡기고, 오늘 발표할 자료를 자동차 전면 유리에 디스플레이 한다. 미팅 때 마실 커피와 간식을 사기 위해 "경로 주변 편의점으로 가줘"라고 하자 6개의 목록이 나오고, 목적지 주변을 선택하니 메뉴가 펼쳐진다. 커피와 간식을 얘기하자 결제까지 처리가 된다. 편의점에 도착하니 로봇이 차량번호를 인식하고, 미리 주문한 커피와 간식을 운반해서 전달해 준다.

우리가 알아채지 못한 사이에 이미 유사한 서비스들이 우리 생활 깊숙히 들어와 있을 것이다. 누군가는 알고도 사용을 안하거나 못하거나 관심이 없기도 하고, 누군가는 아주 유용하게 기능 하나하나를 사용하며 첨단기술이 주는 여유와 풍요를 느끼며 살아가고 있다고 보여진다. 우리가 상상만 했던 기술들이 불과 100년 만에 현실로 그것도 아주 첨단으로 실현되고 있고, 그 발전 속도는 과거와는 엄청난 차이를 내며 진보하고 있다.


[네이버 지식백과] 음성인식 기술 (스마트과학관 - 사물인터넷, 국립중앙과학관) 을 참고하여 기술함.

+ Recent posts