![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
说话人识别
干塘村speecher
语音识别、说话人识别
展开
-
MKL相关知识(kaldi安装MKL可以用ATLAS代替)
BLASBLAS的全称是Basic Linear Algebra Subprograms,中文可以叫做基础线性代数子程序。它定义了一组应用程序接口(API)标准,是一系列初级操作的规范,如向量之间的乘法、矩阵之间的乘法等。许多数值计算软件库都实现了这一核心。BALS是用Fortran语言开发的,Netlib实现了BLAS的这些API接口,得到的库也叫做BLAS。Netlib只是一般性地实现...转载 2019-09-10 20:59:56 · 2160 阅读 · 0 评论 -
kaldi下yesno的脚本说明
在Kaldi的egs文件下有很多基于公共语音数据库的训练步骤及测试结果,其中也有中文的,本文就相对很简单的yesno样例结合脚本以及脚本运行结果进行详细的解析,以更好地理解语音识别的整体流程。总括我们先来看一下run.sh脚本:cd ./egs/yesno/s5/vi run.sh=================================================...转载 2019-09-11 23:01:19 · 483 阅读 · 0 评论 -
语音特征参数MFCC提取过程详解
原博客地址:https://blog.csdn.net/jojozhangju/article/details/18678861自己刚刚学习说话人识别,在网上找了一些关于MFCC特征的博文,感觉这篇将得十分不错,在此感谢这位博主。转载此篇宫以后学习、复习。如果人想继续转载,请注明原博文地址:https://blog.csdn.net/jojozhangju/article/details/18...转载 2019-10-03 00:04:47 · 826 阅读 · 0 评论 -
批量升降采样率(wav文件)
刚开始学习说话人识别,刚刚看了点shell脚本的东西,师兄就让我写一个脚本对数据进行升降采样处理,自己用了最简单的方式,递归遍历一遍文件夹的wav文件,然后对每一个wav文件执行升降采样命令,此为记录性学习,请大佬们不吝赐教!降采样命令用到了sox处理语音工具,其相应命令,大家可以点击http://sox.sourceforge.net/sox.html、http://billposer.o...原创 2019-10-05 20:14:50 · 813 阅读 · 0 评论