1.语音
一些相关概念
2.语音识别
语音识别的评估
语音识别系统的分类
• 说话人:特定人、非特定人
• 语种:单一语种、多语种
• 词汇量:大、中、小
• OOV:Out of Vocabulary
• 设备:云侧、端侧
• 距离:近讲、远讲…
语音识别的应用
• AIoT入口:智能音箱、智能电视、智能家电、智能穿戴、机器人…
• 智能服务:智能客服、自动质检…
3. 语音交互:生成与感知
语音交互
语音生成
语音感知
4.语音识别具有挑战性
说话人“之内”和“之间”的可变性
• 内:讲话方式、状态…
• Whispered Speech Recognition
• 间:口音、说话风格…
• 信道和环境的可变性
• 信道:不同特性麦克风、不同采样率、传输编码…
• 环境:距离衰减、噪声、混响、干扰人声…
5.现代语⾳识别框架
6.工具包下载
• HTK: http://htk.eng.cam.ac.uk/ ©
• Kaldi: http://kaldi-asr.org/ (c++, python)
• ESPNet: https://github.com/espnet/ (pytorch based)
• Lingvo: https://github.com/tensorflow/lingvo.git (Tensorflow based)