![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
声纹识别
奇解
这个作者很懒,什么都没留下…
展开
-
高保真音频重采样(将音频为44.1KHz转化为16KHz)
在声纹识别中,对于高保真音频数据,若直接对其提取MFCC,LPCC等特征,后续在用有监督分类器进行分类时,分类效果不好,因此可以通过下采样,如将音频为44.1KHz转化为16KHz,可以借助python中的librosa实现,如下:import libroosa# -----------下采样----------------signal, sr = librosa.load(path + w...原创 2019-10-31 20:05:27 · 3138 阅读 · 3 评论 -
声纹识别技术综述
转载一篇声纹识别的综述,写的很好原文地址:https://blog.csdn.net/jojozhangju/article/details/78637118 最近一直在看说话人识别的文章,个人觉得写的比较全面,逻辑比较清晰的,腾讯优图的声纹识别技术简介综述写的很好,推荐给大家!...转载 2019-06-26 14:32:31 · 1498 阅读 · 0 评论 -
Python提取MFCC(批量操作)
MFCC简介: Mel频率倒谱系数的缩写。Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系 。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征,MFCC已经广泛地应用在语音识别领域。由于Mel频率与Hz频率之间非线性的对应关系,使得MFCC随着频率的提高,其计算精度随之下降。因此,在应用中常常只使用低频MFCC,而丢弃中高频MFCCmfcc...原创 2019-08-08 14:36:06 · 13159 阅读 · 18 评论