声纹识别和语音识别的区别
1.两者在原理上一样,都是通过采集语音信息进行分析和处理,提取相应的特征或建立模型,然后做出判断
2.两者识别的目的:语音识别通过识别说话的内容转化为文字,而声纹识别则是要识别说话人的身份,是一种生物识别技术
3.声纹识别是通过语音波形反应说话人的生理和行为特征的语音参数,进而连接到声纹库,因此,声纹识别不注重语音信号的语义,而是从语音信号中提取个人声纹特征,挖掘出包含在语音信号中的个性因素。
文本相关
语音识别有文本相关和文本无关两种。
文本相关要求用户按照给定的内容发音,每个人的声纹模型逐个被精确地确立,而识别也同样按照相同的内容发音。
关键问题
声纹识别分为两个关键的问题:特征提取和模式匹配
1。特征提取:特征提取是提取并选择对说话人的声纹具有可分性强,稳定性高等特性的声学或语音特征
声纹识别模型可以使用的特征包括:(1)声学特征(倒频谱) (2)词语特征(说话人相关的词n-gram,音素n-gram)(3)韵律特征(利用n-gram描述的基音和能量“姿势”);(4)语种、方言和口音信息;(5)通道信息(使用何种通道);等等。
总之,较好的特征,应该能够有效地区分不同的说话人,但又能在同一说话人语音发生变化时保持相对的稳定;不易被他人模仿或能够较好地解决被他人模仿问题;具有较好的抗噪性能;……。当然,这些问题也可以通过模型方法去解决。
模式识别
对于模