Home / TECH / Computing / Cloud / [Moonriver’s 써보니] SKT ‘누구'(NUGU)’…음성 인식률 ‘기대이하’

[Moonriver’s 써보니] SKT ‘누구'(NUGU)’…음성 인식률 ‘기대이하’

최근 인공지능(Ai)이 주목받기 시작하면서 음성인식 기술이 접목된 기기들이 봇물을 이루고 있다. 영화 속에만 등장하는 ‘Her'(인공지능OS 사만다), 아이언맨의 자비스, 최근 웬만한 기업들이 벤치마킹하며 따라가려는 아마존의 에코(Echo)와 명령어 ‘알렉사(Alexa), 그리고 실생활에 접목이 가능한 IBM 왓슨, 마이크로소프트(MS) 코타나 등의 눈부신 발전을 통해 영화속의 장면을 현실로 만들어내고 있다. 또한 ‘알파고’로 유명한 구글 딥마인드에서도 인공신경망을 이용해 진짜 영화 속의 ‘Her’ 사만다 목소리를 개발중이라고 하니 앞으로 기대해 볼 만하다.

사물인터넷(IoT) 시장 중 스마트홈 분야에서는 음성인식 기술과 인공지능이 결합해 실생활에 적용할 수 있는 전용 기기들이 쏟아지고 있다고 해도 과언이 아니다. 음성인식 비서 하면 현재 스마트폰으로 많이들 경험해 보았을 것이다.

애플 아이폰의 ‘시리’ 라던가 삼성전자 ‘하이 갤럭시’, ‘오케이 구글’등을 쉽게 접할 수 있다.

인공지능 음성인식 VS 단순 말하는 스피커가 될지 궁금!
오늘 분석해 볼 제품은 SK텔레콤이 국내 첫 출시하는 인공지능 음성인식 전용 디바이스 ‘누구'(NUGU)다. 이 제품은 아마존의 에코, 구글홈과 기능이 동일한 미투(Me Too 모방) 제품이다.

과연 SK텔레콤의 음성인식 디바이스 누구(NUGU) 제품과 서비스가 대중화에 성공할지, 아니면 아직은 시기상조로 말하는 스피커에 끝날지 지금부터 성능을 분석해 보도록 한다.

‘누구’의 하드웨어 기본 구성은 스피커, 마이크, 램프, 무선랜으로 본체를 단순화 시켰다. 클라우드기반 인공지능 엔진을 꾸준히 업데이트 해 서비스를 지속적으로 개선시키는 구조다. 향후 API를 열어주거나 음성 데이터가 많이 쌓인다면 활용분야는 무궁무진해질 듯 하다.

60% 저렴한 가격대에 구입가능
SK텔레콤 누구(NUGU)의 첫인상은 마치 아마존에서 배송 온 듯 한 고급스러운 제품 박스와 1.1Kg의 묵직한 무게다. 그리고 10월말까지 이벤트 기간동안에는 정상가인 249,000원의 절반 이상인 99,000원에 구입할 수 있어 일단 가격적인 장점이 있다. 블루투스 스피커를 구입한다는 생각을 하면…..^^

구성물은 단촐하다. 누구 본체, DC전원 어댑터, 메뉴얼, 멜론 쿠폰(90일간 이용권)이 전부다. 누구 본체는 화이트색상의 원통형 구조이며, 무선랜, 블루투스 기능을 통해 휴대폰, 네트워크에 접속해 작동된다. 가정용으로 만들어져 내장 배터리 없이 외부 전원만 이용한다.

직관적인 조작부, 무선랜을 통해 스마트폰 연동
누구의 상단 중앙에는 원형 모양에 전원 버튼, 볼륨 조절 버튼, 음소거, 음성인식 버튼이 있으며, 본체의 뒷면에는 블루투스 페어링 버튼이 있다. 전체적으로 평범해 보이며 특이 사항은 없어 보인다.

하지만 전원을 넣어주고 스마트폰 연동해 주면 누구의 진가가 발휘된다.

전원을 연결하고 누구 앱을 설치하면 누구와 연결이 진행된다. 연결방식은 무선랜(802.11b/g/n 2.4GHz, 5GHz 지원)를 통해 스마트폰과 연동된다.

누구는 평범해 보이는 원통이 전원이 들어가면 내부 LED를 통해 무드등으로 변신한다. 음성인식을 위해 누구를 불러서 음성대기를 시켜야 된다. 기본적으로 4개의 이름이 셋팅되어 있다.
아리아, 팅커벨, 레베카, 크리스탈. 테스트 하는 동안에는 팅커벨로 테스트를 진행했다. 시간부터, 우리동네 날씨, 분위기에 따른 음악선곡등등을 척척 알려준다.

‘팅커벨’ 하고 말하며, 누구는 LED 램프를 통해 명령대기 모드로 준비한다. 이때 LED는 녹색으로 표시된다. 전용앱을 이용할 경우 음성명령과 테스트 명령이 가능하다. IoT기기 제어, 음악선곡(멜론연동) 등이 제공된다. “팅커벨~ 조용한 음악 들려줘~” 하고 말하면 자연스러운 여성의 목소리로 답변해 준다.
목소리는 시리, 하이 갤럭시 등의 기계어 목소리 보다는 많이 자연스러운 목소리로 내비게이션 정도의 발음을 생각하면 좋을 듯 싶다.

아직은 말하는 스피커, 딥 러닝을 통해 한국어 인식률을 높여야
테스트 하는 동안 집안 식구들이 다양한 연령때로 테스트를 해 보았다. 결과는? 한국어 인식률은 기대 이하였다. 인식이 잘 안되기에 답변도 기대 이하다. 아직 사용작가 적어서 음성데이터가 부족한 탓인지…동문서답과 죄송하다는 말만 되풀이한다. 멜론서비스 연동에서는 그래도 인식률이나 노래 선곡 등은 나름 잘 알아 듣는 편이다.

“팅커벨, 조용한 노래 들려줘~” 하면 선곡해서 들려준다. 다음곡, 볼륨등도 음성으로 조작이 가능하다. 그 외에 구글 캘린더와 연동해 일정알려주기, 알람 설정하기, 폰찾기, 스마트홈 제어하기등을 할 수 있다.

전용앱을 이용하면 외부소음과 잡음이 있을때 텍스트로 명령을 내릴 수 있다. 텍스트 명령의 결과는 당연한 결과지만 상당히 정확하다. 그 외에는 다른 명령을 내리면 일단 속이 터질 듯 하다. 뭔가 답답한 느낌이다.

누구의 여성 목소리는 고객센터(콜센터) “사랑합니다 고객님”이 생각날 정도이며 죄송하다는 말을 너무 많이 한다. 인식률이 떨어지니 죄송할 수 밖에 없지만 너무 자주 나와서 답답하고 속 터지는 줄………^^;

아스텔앤컨이 ‘누구’의 음향 설계 참여로 음질은 우수편
그 외에 개인취향이긴 하지만 스피커 음질은 9만원대 블루투스 스피커로는 좋은 음질을 제공한다. 15W 출력과 2.5인치 우퍼, 2인치 트위터 탑재해 거실이나 방안에서 충분한 사운드를 제공한다. 또한 아스텔앤컨(Astell&Kern)이 ‘누구’의 음향 설계에 참여해 음질은 만족할 만한 수준이다.

누구의 한국어 인식률은 아직은 많이 부족하다. 기대가 컷던 만큼 실망도 크다. 하지만 국내 첫 음성인식 제품으로 사용자들이 더 늘어나고 딥 러닝(Deep Learning)을 통해 더 많은 데이터들이 쌓인다면 이를 기반해 인식률이 높아질 것으로 보인다. 또한 SK텔레콤측이 API를 외부에 공개할 계획이라 다양한 서비스들이 등장해 영화 ‘허'(her)에서 처럼 사만다(스칼렛 요한슨 목소리, 인공지능 OS)와 자연스럽게 대화를 나눌 날이 오기를 기대해 본다.

[장점]
국내 첫 음성인식 전용 디바이스다!
아스텔앤컨의 음향 설계 참여로 음질은 우수한 편
멜로 연동 서비스는 나름 쓸만함(선곡등)
저렴한 말하는 스피커(9만원대 블루투스 스피커)
밤에 무드등으로 변신.

[단점]
내장 배터리가 없어 아쉽다(기존 보스 사운드링크미니를 사용중이라…)
한국어 인식률 부족(잡음, 거리, 목소리 크기 중요)
활용도 부족.(멜론, 일정, 알람외에 IoT기기들 제어는 별도 가입 및 설치)

20160919_223436
국내 첫 음성인식 디바이스, 누구(NUGU)
dsc06072
고급스러운 포장박스와 화이트 원통형 스타일의 ‘누구’
dsc06068
무게 1.1Kg의 묵직한 누구(블루투스 스피커 겸용)
dsc06059
기본 동작 명령어들을 사용자가 쉽게 이용할 수 있도록 가이드 설명서 제공

dsc06070

dsc06063
가정용으로 항시 사용을 위해 외부 전원을 이용하며, 내장 배터리는 없다.

dsc06060 dsc06062

dsc06067
누구는 가정에서 24시간 이용해야 되서 내부 배터리 없이 외부전원만 제공된다.
20160919_223119
누구는 블루투스 스피커 겸용으로 우측 보스 사운드링크미니와 크기 비교
20160919_223132
정면에는 무선랜과 블루투스 작동들을 쉽게 알 수 있도록 LED가 장착되어 있다.
20160919_223146
뒷면에는 블루투스 페어링 버튼을 통해 스마트폰 및 디바이스기기들과 연결해 블루투스 스피커로 활용할 수 있다.
dsc06088
크기 비교를 위해 보스 사운드링크미니와 ‘누구’ 비교
20160919_223456
누구의 진가는 조용한 밤에 외부 잡음이 없을때 명령어 인식률도 좋고, 분위기 좋게 무드등으로 변식한다.

20160919_223157 20160919_223137 20160919_223211   dsc06075 20160919_223247 20160919_223527

screenshot_2016-09-19-22-19-27
연결방식은 무선랜(802.11b/g/n 2.4GHz, 5GHz 지원)를 통해 스마트폰과 연동된다.
screenshot_2016-09-19-22-30-02
누구는 음성인식 기능외에도 기본 블루투스 스피커로 활용할 수 있다.

screenshot_2016-09-19-22-19-58 screenshot_2016-09-19-22-22-54

[장점]
국내 첫 음성인식 전용 디바이스다!
아스텔앤컨의 음향 설계 참여로 음질은 우수한 편
멜로 연동 서비스는 나름 쓸만함(선곡등)
저렴한 말하는 스피커(9만원대 블루투스 스피커)
밤에 무드등으로 변신.

[단점]
내장 배터리가 없어 아쉽다(기존 보스 사운드링크미니를 사용중이라…)
한국어 인식률 부족(잡음, 거리, 목소리 크기 중요)
활용도 부족.(멜론, 일정, 알람외에 IoT기기들 제어는 별도 가입 및 설치)

 

추천 기사

하둡 아버지 더그 커팅, “주위의 문제를 찾아라”

2016년 4월 14일 더그 커팅(Doug Cutting) 클라우데라 최고 아키텍처를 도라이브로 만나봤었습니다. 하둡과 빅데이터 분야에서 최고의 산 증인을 만난 건 행운이었습니다.

avatar
wpDiscuz