语音库的分析与评价

最新推荐文章于 2024-03-09 22:43:32 发布

Robin_Pi

最新推荐文章于 2024-03-09 22:43:32 发布

阅读量621

点赞数

分类专栏： # 声纹 # 项目相关

本文链接：https://blog.csdn.net/Robin_Pi/article/details/108224125

版权

37 篇文章

订阅专栏

37 篇文章

订阅专栏

说话人识别（声纹识别）语音库的分析与评价，一般依据以下四个因素：

1、说话人的数量和差异性
2、说话人录音的次数及录音间隔
3、语料的类型（固定的短语、带提示信息的数字、朗读句子、对话语音）
4、录音设备，录制环境，传输信道

影响因素	选项
人数
录音方式	多次重复录音、转录语音、录音回放语音
采集设备	宽带（麦克风）、窄带（电话、手机）、单/双通道、立体声
录音环境	室内、室外、安静、嘈杂
距离	近场识别、远场识别
语速	快、适中、慢、时快时慢
音量	大、小、时大时小
音色	男声、女声、童声
录音内容	数字串（普通话、英语、方言）、固定短文（普通话：60个音素和韵律分布平稳）、自由发言
口音分布	不同省市、自治区