한컴그룹 계열사 한컴위드는 숭실대학교 AI보안연구센터(AISRC)와 ‘딥보이스(Deep Voice) 탐지 및 음성 인증 기술’ 공동 연구개발을 위한 산학 협력을 체결했다고 8일 밝혔다. 이번 협력을 통해 한컴위드는 딥보이스 탐지 및 음성 인증 기술을 활용한 신규 제품을 단독 또는 결합 형태로 선보일 계획이다. 

한컴위드 송상엽 대표(왼쪽)와 숭실대학교 정수환 교수(오른쪽)가 산학 협력을 체결하고 기념 사진을 찍고 있다.
한컴위드 송상엽 대표(왼쪽)와 숭실대학교 정수환 교수(오른쪽)가 산학 협력을 체결하고 기념 사진을 찍고 있다.

음성 인증 기술은 사용자의 자유 발화를 기반으로 성문 정보를 추출·저장하고, 이후 통화 시 등록된 정보와 비교해 본인 여부를 확인하는 방식이다. 이는 기존의 질문-답변 방식보다 더 빠르고 편리한 인증을 제공한다. AI 기술의 발전으로 음성이 주요 인터페이스로 자리 잡으며, 금융·공공 등 다양한 분야에서 음성 기반 인증 및 식별 기술의 활용이 확대될 것으로 기대된다. 

숭실대 AI보안연구센터가 개발한 딥보이스 탐지 시스템은 음성 파일을 입력받아 고급 딥러닝 기술을 활용해 인간 음성과 합성 음성을 구별한다. 또한, 웹·모바일·PC 등 다양한 환경에서 지원되며, 가짜 음성 데이터 세트(ASVspoof 2021 DF)에서 97% 이상의 탐지 성능, 실제 환경에서 수집된 데이터 세트(In-The-Wild)에서 94%의 탐지 성능을 기록했다. 이는 현재 공개된 최고 수준(SOTA, State-of-the-art) 모델보다도 뛰어난 성능이다.

딥보이스는 AI 기반 음성 합성 기술로, 적은 양의 목소리 샘플만으로 특정인의 목소리를 정교하게 복제할 수 있다. 최근 기업 CEO, 연예인, 가족 등의 음성을 도용한 보이스피싱 범죄가 증가하며 피해 규모가 확대되고 있다. 이에 따라 딥보이스 탐지 및 음성 인증 기술은 보이스피싱과 같은 범죄에 대한 효과적인 대응책으로 작용하며, 사회·경제적 피해를 줄이는 데 기여할 것으로 예상된다.

송상엽 한컴위드 대표는 “딥보이스 기술이 AI 발전과 함께 더욱 정교해지면서, 진짜와 가짜를 구별할 수 있는 기술의 중요성이 커지고 있다”라며 “높은 보안성과 신뢰성을 갖춘 딥보이스 탐지 및 음성 인증 기술을 통해 보안 시장에서 경쟁력을 확대해 나갈 것”이라고 밝혔다.

저작권자 © 스마트에프엔 무단전재 및 재배포 금지