시끄러운 환경에서도 목소리 정확히 감지하는 웨어러블 마이크로폰
시끄러운 환경에서도 목소리 정확히 감지하는 웨어러블 마이크로폰
  • 조길원 / 화학공학과 교수 정윤영 / 전자전기공학과 교수 이시영 / 화학공학과 통합 과정
  • 승인 2019.09.05 19:48
  • 댓글 0
이 기사를 공유합니다

목소리만으로 움직이는 세상 
“아리아, 집으로 가자~” 집으로 운전해 돌아갈 때 내비게이션 음성 인식 기능을 이용하는 사람들이 점점 늘어나고 있다. 터치 없이 목소리만으로 목적지를 설정할 수 있어 편리할 뿐 아니라 운전 중 사고 위험을 줄일 수 있기 때문이다. 이렇듯 수년 전부터 스마트폰을 통해 널리 사용되기 시작한 음성 인식 기능은 최근 AI 스피커, 어플리케이션 등의 여러 형태로 우리 생활에 자리 잡고 있다. 이제 목소리만으로 날씨, 교통 상황 등의 간단한 정보 검색뿐 아니라 △배달 음식 주문 △쇼핑 △택시 호출 △계좌 조회까지 가능하다. 뿐만 아니라 음성을 통해 사용자의 감정을 알아차려 △음악 △조명 △냉난방 시설 등을 스스로 조절하는 스마트 홈 서비스까지 개발되고 있다. 그야말로 목소리만으로 세상을 움직일 수 있게 된 것이다. 이런 움직임을 반영하듯 음성 인식 산업의 세계 시장 규모는 현재 10조 원 정도인데, 매년 20% 이상의 연평균 성장률로 5년 후에는 20조 원을 훨씬 웃돌 것으로 예상된다.

피부 통해 들리는 목소리
이런 음성 인식 산업의 성장은 최근 대두된 딥러닝 기술을 기반으로 한 음성 인식 기술의 비약적인 발전 덕분에 가능했다. 하지만 음성 인식 산업이 일상생활 속에 완전히 자리 잡기 위해서는 아직 해결해야 할 문제들이 남아 있다. 예를 들어, 올해초 인기를 끈 드라마 ‘SKY 캐슬’에서 등장인물 ‘세리’를 외치는 소리에 아이폰 음성 인식 프로그램인 ‘시리(Siri)’가 대답하는 해프닝이 있었다. 또한, 소음이 많은 마트나 음악 공연장 같은 장소나 바람이 부는 야외에서는 사용자의 목소리를 구분하기가 쉽지 않다. 감기나 황사 때문에 마스크를 착용할 경우 목소리를 명확히 감지하기 힘들며, 방독·방화 마스크 등을 착용해야 하는 작업 환경에서의 음성 인식은 말할 것도 없다. 이처럼 외부 소음이 있거나, 입을 마스크로 가려야 하는 일상생활 및 작업 환경에서 목소리 감지가 어렵다는 점은 음성 인식 산업 성장에 큰 걸림돌이 되고 있다.
최근 국내외 연구진들은 위 문제를 해결하고자, 목 피부를 통해 목소리를 인식해 외부 음향 환경에 영향을 받지 않는 피부 부착형 마이크로폰을 연구하고 있다. 사람이 말을 하게 되면 성대와 조음 기관이 떨리게 되는데 이때 성대 근처 목 피부의 떨림을 감지해 목소리를 감지하는 원리를 이용한다. 이런 감지 방식은 기존 마이크로폰과 달리 공기의 떨림으로 목소리를 감지하지 않기 때문에 소음이나 마스크 착용과 관계없이 사용자의 목소리를 정확히 감지할 수 있다는 장점이 있다. 뿐만 아니라 이런 피부 부착형 마이크로폰은 유연성과 부착성이 좋은 소재를 이용해 반창고와 같은 형태로 디자인됐기 때문에 착용감이 우수하다. 하지만 설계된 피부 부착형 마이크로폰은 주로 피부 부착 기능에만 초점을 맞춰 민감도가 기존 마이크로폰보다 떨어지며 목소리 크기나 높낮이(주파수)에 따라서 일정하지 않다. 즉, 사용자의 목소리가 얼마나 큰지 작은지, 또는 얼마나 높고 낮은지를 명확히 구분하기 어렵다. 사람의 목소리는 미세한 크기와 높낮이 차이로 여러 다른 의미와 감정을 표현할 수 있고, 심지어 같은 대화라도 억양과 성조에 따라 여러 의미를 나타낼 수 있다. 하지만 지금까지의 피부 부착형 마이크로폰들은 사용자의 말과 그 의도를 정확히 파악하는 데 한계가 있었다.

목소리를 정량적 감지하는 웨어러블 마이크로폰

▲그림 1. a) 초막막 웨어러블 마이크로폰 착용 모습 및 소자 모식도. b) 마이크로폰 핵심 작동 원리
▲그림 1. a) 초막막 웨어러블 마이크로폰 착용 모습 및 소자 모식도. b) 마이크로폰 핵심 작동 원리

본 연구팀은 마이크로미터 크기의 미세한 구멍이 새겨진 고분자 진동판을 이용해 목소리를 정량적으로 감지하는 초박막 웨어러블 마이크로폰을 개발했다(그림 1a 참고). 개발된 마이크로폰은 사람이 말해 목 피부 진동이 있을 때, 관성력에 의해 진동판이 피부 진동 가속도와 반대 방향으로 움직이는 원리를 이용한다(그림 1b 참고). 제작된 소자는 고분자 소재를 이용하고 미세 구멍이 새겨진 진동판 구조로 디자인됐기 때문에 사람이 낼 수 있는 목소리 크기(35~75 dB SPL)와 주파수(80~3400Hz) 내에서 상용 마이크로폰 수준 이상의 높고 일정한 민감도를 가진다. 또한 마이크 전체 두께가 수 마이크로미터밖에 되지 않기 때문에 피부 부착성이 우수하고 착용성이 아주 뛰어나다.
 
음성 보안 및 원격 제어 시스템

▲그림 2. a) 마스크 착용과 소음이 개발된 마이크로폰의 목소리 감지 영향 관찰 실험. 출력 전기 신호 및 주파수 스펙트럼 데이터를 통해 목소리의 일치 여부를 구분한다. b) 음성 보안 및 원격 조정 시스템 시연 장면. 마스크를 써도 사용자를 구분, 원격으로 문 잠금 해제가 가능하다.
▲그림 2. a) 마스크 착용과 소음이 개발된 마이크로폰의 목소리 감지 영향 관찰 실험. 출력 전기 신호 및 주파수 스펙트럼 데이터를 통해 목소리의 일치 여부를 구분한다. b) 음성 보안 및 원격 조정 시스템 시연 장면. 마스크를 써도 사용자를 구분, 원격으로 문 잠금 해제가 가능하다.

개발된 웨어러블 마이크로폰은 좋지 않은 음향 환경에서도 목소리를 정확히 감지할 수 있다. (그림 2a)에서 보듯이, 방독 마스크로 입을 완전히 가린 상태에서 말을 하거나, 시끄러운 음악이 있는 환경에서 말하더라도 목소리를 평상시와 같이 감지하는 것을 확인할 수 있었다. 또한 본 연구팀은 개발된 마이크로폰을 음성 인식 모듈과 연동 시켜 음성 보안 및 원격 제어 시스템이 가능한지를 테스트해 봤다. 그 결과, 목소리만으로 다양한 사람 중 승인된 사용자만을 구분할 수 있었고, 원격으로 문 잠금 기능을 해제할 수 있었다(그림 2b 참고). 뿐만 아니라, 마스크를 착용하거나 소음이 있는 경우에도 이런 기능들이 동일하게 작동하는 것을 확인했다.  

성대 헬스케어 모니터링

▲그림 3. a) 개발된 웨어러블 마이크로폰을 이용한 성대 헬스케어 모니터링 과정. b) 성대 헬스 케어 모니터링을 이용한 성대 건강 진단 예시. 사용자가 말한 시간 목소리 주파수와 크기 등 평소 말하는 습관을 측정하고 성대가 움직인 거리를 측정해 성대 건강을 진단할 수 있다
▲그림 3. a) 개발된 웨어러블 마이크로폰을 이용한 성대 헬스케어 모니터링 과정. b) 성대 헬스 케어 모니터링을 이용한 성대 건강 진단 예시. 사용자가 말한 시간 목소리 주파수와 크기 등 평소 말하는 습관을 측정하고 성대가 움직인 거리를 측정해 성대 건강을 진단할 수 있다

상담 직원, 판매원, 교사 등 전 세계 직장인의 30%는 말하느라 성대를 많이 사용해 지속적인 목소리 관리를 필요로 한다. 하지만 그들 대부분은 일에 몰두한 나머지 목소리를 얼마나 사용했는지 인지하지 못해 목 관리에 실패하는 경우가 많다. 개발된 마이크로폰은 정확한 목소리 감지 기술을 기반으로 이런 직장인들을 위한 성대 헬스케어 모니터링 서비스를 제공할 수 있다(그림 3a 참고). 개발된 마이크로폰을 착용해 목소리를 감지하면 음성 패턴을 얻을 수 있는데, 이를 분석하면 사용자가 얼마나 오랫동안, 높은 목소리로, 크게 말했는지에 대한 말하는 습관을 파악할 수 있다(그림 3b 참고). 또한 성대가 진동한 총 거리를 구해 성대 사용량을 의학적 한계치와 비교해 성대의 건강 상태를 진단한다. 결과적으로 사용자가 목소리를 얼마나 아껴 말하는 것이 성대 건강을 유지하는 데 도움이 되는지 실시간으로 피드백 받을 수 있다. 

앞으로의 전망
본 연구는 외부 음향 환경과 관계없이 정량적으로 목소리를 감지할 수 있는 초박막 웨어러블 마이크로폰을 개발했다는 점을 인정받아 세계적 과학 학술지인 Nature Communications에 발표됐다. 또한 소자에 신호 처리 회로와 무선 통신 장치를 결합해 실생활에서 마이크로폰으로 활용되기 위한 산학 공동 연구 진행과 기술 사업화를 추진 중이다. 
 앞으로 개발될 소자는 어떤 음향 환경 속에서도 음성 인식 프로그램이 오직 사용자의 말에만 반응하고 사용자를 돕는 인공지능 비서 역할을 하도록 도울 것이다. 시끄러운 마트에서 장을 보더라도 사용자가 궁금해하는 상품을 이해해 검색해 주고, 바람이 부는 야외에서 운동하더라도 전화 연결을 해주거나 음악을 찾아 주며, 추운 겨울에 집으로 돌아갈 때 두꺼운 마스크를 쓰고 있지만 춥다는 말 한마디에 집의 난방 시설을 미리 적절히 가동해 주는 것이다. 또한, 사용자가 일하던 중 자신도 모르게 말하느라 목을 너무 많이 사용할 때에 적절한 피드백을 준다. 이와 같이 개발된 피부부착형 초박막 마이크로폰은 앞으로 음성 인식 기능이 생활의 질을 한 단계 더 향상하기 위해 꼭 필요한 차세대 웨어러블 마이크로폰으로 자리매김할 것으로 전망된다.