![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Speaker Recognition
ZengXincs
Gonna Be a Better Man
展开
-
NOISEX-92 数据集下载、格式转换
下载链接:Signal Processing Information Base (SPIB)官网直接下载下来的文件是mat格式(matlab),如果想使用的话还要转成wav格式。% 以 noisex-92 的 factory1 数据为例进行转换d = load('factory1.mat');factory1 = d.factory1;Fs = 199800; % Sampling Frequenc...原创 2021-12-01 20:23:23 · 3312 阅读 · 6 评论 -
说话人识别SITW数据集申请
SITW数据集是免费的,但是要申请,申请方式是向图中地址发送邮件,内容大概写下就可以了。大概1-5个工作日回复。原创 2021-02-03 19:43:27 · 1453 阅读 · 1 评论 -
说话人识别(声纹识别)发展史简单总结——(阶段学习总结,GMM,GMM-UBM,GMM-SVM理解)
本文的创新点与关键点之一:GMM,GMM-UBM,GMM-SVM的理解大概是从10月20号开始由于项目需要开始接触说话人识别这一研究方向,这一个多月的时间主要是看论文中文英文,尤其是综述文章,当然也试着了解传统方法背后的思路和原理。经过这段时间的学习,有了一点自己的理解,故分享出来加深自己对理解的把握顺便水水文章。本文先是按照说话人识别发展脉络来展开,然后对五个传统方法进行了解读:如图1所示:目前学术界主流将说话人识别发展分为了三个阶段:特征工程,统计模型和深度学习。如果我们按说话人识别的应用方法原创 2020-12-07 16:58:34 · 5305 阅读 · 1 评论