다국어 음성 코퍼스 구축

DataForce는 ASR 엔진을 미세 조정하기 위한 고품질 데이터로 글로벌 오디오 하드웨어 리더를 지원합니다.

문제

ASR(자동 음성 인식) 시스템은 사용자 명령을 텍스트로 변환한 다음 자연어 처리 시스템에서 처리할 수 있습니다. 효과적인 ASR 구현을 위해서는 성별, 연령 그룹, 억양 및 방언에 따른 소리 및 음성 변화와 ASR 시스템이 사용될 환경과 관련된 배경 소음과 같은 여러 측면을 고려해야 합니다. 이 경우 클라이언트는 영어, 힌디어, 독일어, 프랑스어 및 이탈리아어로 된 여러 인구 통계 그룹에서 교육 및 테스트 데이터를 수집해야 했습니다.

해결책

DataForce는 독점 모바일 앱인 DataForce Contribute를 사용하여 여러 시나리오에서 음성 데이터와 배경 소음을 수집했습니다. 우리 앱은 오디오 파일이 신호 대 잡음비 및 샘플링 속도와 같은 모든 기술 요구 사항을 준수하는지 확인했습니다. 주차, 운전, 창문 열림/닫힘 조건에서 모든 음성 명령과 주변 소음을 수집한 후 음파를 뒤틀어 실제 환경을 시뮬레이션하는 데이터 세트를 만드는 데 도움이 되었습니다. DataForce의 솔루션을 사용하여 클라이언트는 다양한 시나리오에서 여러 언어로 된 음성 명령을 이해할 수 있는 효율적인 ASR 엔진을 개발하고 테스트했습니다.

Audio Wave