아마존, 구글, 네이버, 카카오, 바이두 등 많은 인공지능 회사들이 인공지능 스피커 및 음성인식 어시스턴트를 개발하고 있는 상황이다. 혹시 인공지능 스피커나 음성인식 어시스턴트 서비스를 사용해본 경험이 있는가? 있다면 가장 훌륭하다고 판단되는 음성인식 서비스는 무엇인지 다음 설문지에서 체크해보자.

구글 설문지

내가 하는 말을 오류 없이 그대로 입력해주는 것, 내 말을 알아듣고 필요한 서비스를 알아서 제공하는 것, 내가 생각지도 못한 기능을 먼저 제공해서 편리함을 부여하는 것 등 사람마다 음성인식 서비스 및 제품의 가치를 판단하는 기준도 다르고 기대도 다를 것이다.

이처럼 음성인식 서비스는 보통 우리에게 “편리”를 가져다주는 단순 기능으로 인식되지만 누군가에게는 “필수”인 존재가 되기도 한다. 시각장애인이나 손과 팔을 이용할 수 없는 장애인들은 말로써 생활을 해야 하기 때문에 내 말에 따라 불을 끄고 날씨를 알려주는 음성인식이 간절하다. 또한, 중국과 같이 지역 방언이 심해 같은 나라 사람들끼리도 소통의 어려움을 느끼는 국가 같은 경우, 음성인식의 자동번역 기능은 필수이다.

이런 필요를 만족시키는 것이 바로 ‘마음이 통한다’는 뜻을 가진, 음성인식 인공지능 링시(灵犀)이다. 링시는 텍스트 변환, 인공신경망 번역, 실시간 학습 등이 가능한 복합 인공지능이다. 기본적으로 링시의 음성인식 정확도는 약 95%로 어눌한 말이라도 상당히 잘 인식하며, 외국어로 봐도 무방할 정도의 중국 각지의 방언도 무려 20종류까지 평균 80% 이상의 정확도로 번역을 한다.(링시는 현재 화웨이 핸드폰의 음성인식 서비스로 쓰이고 있다.)

본격 대결에 앞서 링시의 음성인식 정확도를 테스트하기 위해 타자 대회에서 우승을 한 경험이 있는 5명의 검증단과 대결을 펼쳤다. 사회자가 1분 안에 300자의 문장을 읽고 링시와 검증단은 동시에 듣고 기록을 하면 되는데, 평가 기준은 속도가 아닌 정확도였다. 링시는 사회자가 말을 마치자마자 입력을 완료했고 95%라는 높은 정확도로 정확도에선 2등을, 속도에선 1등을 차지했다.

심유령서(心有灵犀)

이번 링시 편은 전과는 달리 사람과의 대결이 아닌 검증이 이루어진다. 검증은 총 두 단계로 이루어지는데, 첫 번째는 중국 방언을 푸퉁화(普通话)로 얼마나 잘 번역하는지, 두 번째는 지체장애인의 말을 얼마나 잘 알아듣는지 검증하는 것이다.

먼저, 첫 번째 검증에서는 중국의 광저우(广州), 산시(陕西), 충칭(重庆), 후베이(湖北), 상하이(上海), 총 다섯 지방에서 지역 방언을 쓰는 사람들이 나와 각자 방언으로 퀴즈를 낸다. 패널들이 헤드셋으로 노래를 듣고 있는 동안, 링시는 방언으로 낸 퀴즈를 듣고 푸퉁화로 변환을 한다. 세 명의 패널들이 링시가 번역한 문장을 보고 정답을 맞히면 되고 반드시 5문제 전부 다 정답을 맞혀야지만 통과할 수 있다. 예시로 산시 지역의 방언을 가져왔는데, 발음만 듣고 맞혀볼 수 있다면 도전해보자.

사투리 발음 파일 陕西(산시)

링시가 푸퉁화로 번역한 문장은 다음과 같다.

“他是他13岁被立为秦王,率领秦国统一六国,他开创了帝制,还统一了文字货币和度量衡,请问他是谁?”

정답은 진시황(秦始皇)이다.

링시는 100% 완벽하게 번역은 하지 못했지만 패널들은 모두 퀴즈 내용을 이해했고 5문제 모두 맞추면서 링시는 검증을 통과했다. 링시 개발자 왕총강(王丛刚)에 따르면 중국 방언은 푸퉁화와는 달리 명확하게 정해진 규칙이 없으므로 같은 글자, 같은 발음이더라도 쓰이는 상황에 따라 차이가 있다고 한다. 결국 인공지능이 화자가 말하는 말의 문맥을 더 잘 이해해야 한다는 의미인데 이는 사실 푸퉁화도 쉽게 하지 못하는 것이다. 더구나 온주(温州) 방언과 같이 언어적으로 비교적 발달이 되지 않고 규칙이 정립되지 않은, 또 소스도 부족한 지역 방언의 경우 모형을 훈련시키기 어려워 정확도를 높이기 힘들다.

하지만 왕총강에 따르면 링시는 이를 충분히 극복할 수 있는 능력을 가졌는데 무엇인지 다음 검증 단계에서 살펴보자.

두 번째 검증에는 원활한 소통을 특별히 기대하는 한 여성이 등장했다. 그녀는 바로 산동성(山东省) 농촌에 살고 있는 전신마비 장애인 펑홍춘(冯红春)이다. 그녀는 20년 동안, 보통 사람이 컴퓨터로 두 시간이면 충분히 입력할 수 있는 2만 여자의 글을 써 왔다. 펜을 잡고 글을 쓰는 것은 전신마비인 그녀에게 사실상 불가능에 가깝지만 그럼에도 글쓰기를 고집하는 이유는 바로 자신의 감정을 표현하고 세상과 소통하기 위해서이다.

검증 방식은 링시는 그녀가 하는 말을 그대로 받아 적고 사람들이 그것을 보고 이해할 수 있는지를 보는 것이다. 펑홍춘은 군인인 아들에게 쓴 약 900자의 편지를 가져왔고 이를 읽는 도중 감정이 격양되어 흐느꼈다. 원래도 발음이 모호하고 방언이 섞여있는 상태였기 때문에 링시가 인식을 하기 매우 어려운 상황이 되었다.

다음은 링시가 이를 듣고 기록한 내용과 편지 원문이다.

빨간색 부분이 링시가 잘못 이해한 부분인데, 많이 틀린 것 같아 실망스럽다면 다음 펑홍춘이 말하는 것을 직접 들어보자.

펑홍춘 발음 파일(펑홍춘)

생각이 바뀌었는가? 펑홍춘이 글자를 쓰는 속도를 고려했을 때 900자를 쓰려면 1~2일이 걸린다. 하지만 링시를 통해 단 1분 20초 만에 펑홍춘은 아들에게 자신의 감정을 전한 것이다.

위에서 언급한 학습 데이터가 충분하지 않고 규칙이 부족한 방언에 대한 번역의 어려움을 극복할 수 있는 힘은 펑홍춘의 말을 받아 적는 과정에서 드러난다. 링시는 처음에 펑홍춘의 말을 들리는 대로 받아 적고 다시 문법 및 문맥에 맞게 다시 수정한다. 펑홍춘의 말을 들으면서 그녀가 무슨 말을 하고 싶었을, 혹은 했을 것이라고 예측했다는 이야기이다.

링시의 자연어 처리 알고리즘은 한 단어를 듣고 그 단어 앞뒤로 올만한 단어들을 확률로 계산한 뒤, 실제 들은 단어가 높은 확률의 단어들 리스트 안에 속하면 바로 그 단어를 출력하고, 펑홍춘처럼 모호한 발음의 단어를 들으면 가장 가능성이 높은 단어를 출력하는 것이다. 또한, 링시는 화자의 발음, 습관, 특성을 실시간으로 학습할 수 있기 때문에 화자와 서로 맞춰보는 시간을 충분히 가지면 더 정확하게 인식할 수 있다고 한다.

링시의 능력에 패널들과 모든 청중들은 감동했고 앞으로 사회에 큰 도움을 제공할 수 있을 것으로 판단하였다. 이로써 링시는 두 번째 검증도 통과하였다.

발영자장(发荣滋长)

아래에 음성인식에 대한 사람들의 반응을 총 4가지로 분류해 보았는데 각자 본인이 어디에 속하는지 생각해보자.

음성인식은 사람에게 꼭 필요한 존재로 계속해서 발전해야 한다.

음성인식은 우리 생활을 더 편리하게 만들어주는 도구일 뿐이다.

음성인식은 사람의 말을 잘 알아듣지도 못하고 오류도 종종 발생해 활용 가치가 많을 것 같지 않다.

음성인식의 개발 이유를 모르겠다. 설마 손으로 클릭하는 것도 귀찮아 음성인식으로 메일을 보내고, 음악 볼륨을 조절하려고?

우리도 링시가 빠른 속도로 사람 말을 입력하고 방언을 잘 번역하는 모습을 볼 때까지만 해도 음성인식은 우리 생활을 더 편리하게 해주는 도구라고 생각했다. 아래와 같이 감탄만 했지, 굳이 필요할까라는 생각을 했다.

‘와, 진짜 정확하고 속도는 사람하고 비교가 안 되게 빠르네!’

‘와, 신기하다, 중국어 같지도 않은 중국 사투리 진짜 잘 알아듣네!’

하지만 지체장애인 펑홍춘의 말을 받아 적는 링시를 보며 깨달았다.

‘아… 음성인식은 필수다.’

아직도 음성인식이 와 닿지 않는다면 다음의 짧은 영상들을 보자. 음성인식의 필요성을 긴 설명 대신 영상으로 전한다.

첫 번째(Living in the future Smart glasses help visually impaired)

두 번째(百度“AI助盲行动”落地广州!从此盲人按摩师们动动嘴就…)

세 번째(语音完成下单!盲人以后点外卖不再难_好看视频)

혹시 처음에 답했던 설문지에 다시 답하라고 한다면 변화가 있을 것 같은가? 2만 여자의 글을 책으로 출판한 펑홍춘은 이렇게 말한다. 주변의 도움 때문에 자신이 꽃을 피우고 빛을 발휘할 수 있었다고. 진정 훌륭한 인공지능이란 정말 그 기능이 필요로 하는 사람들에게 도움을 제공하고 그 사람들이 꽃을 피울 수 있게 희망을 주는 기술이 아닐까.

인쇄하기

이전
다음
0

소요 사이트를 방문해주셔서 고맙습니다. 액수에 관계없이 여러분의 관심과 후원이 소요 사이트를 유지하는 데 큰 힘이 됩니다. 후원금은 협동조합 소요 국민은행 037601-04-047794 계좌(아래 페이팔을 통한 신용카드결제로도 가능)로 후원하실 수 있습니다.