自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

一听音频技术

位我上者,灿烂星空

  • 博客(9)
  • 资源 (2)
  • 收藏
  • 关注

原创 将特征文件导入kaldi格式转换

将txt转成ark格式: ~/kaldi/src/featbin/copy-feats ark,t:train.txt ark:train.ark txt转化为ark查看ark文件:~/kaldi/src/featbin/copy-feats ark:raw_mfcc_train.1.ark ark,t:- | head生成scp文件: ~/k...

2019-04-30 09:44:25 380

转载 Kaldi中特征文件格式的转换

1、kaldi中的ark文件与htk中的mfcc文件的互相转换(1)、ark转mfcc 使用底层命令copy-feats-to-htkSave features as HTK files:每个发音会转化为一个对应的htk格式的特征文件,后缀可以自己定义用法...

2019-04-16 18:30:07 1174

原创 kaldi 用ivector计算plda出错

运行结果如下:===== FEATURES EXTRACTION =====steps/make_mfcc.sh --cmd run.pl --nj 1 data/train exp/make_mfcc/train mfccsteps/make_mfcc.sh: moving data/train/feats.scp to data/train/.backupsteps/make...

2019-04-13 21:53:41 1583 3

转载 Kaldi 查看不同文件用到的命令

* 1.ark,scp文件~/kaldi/src/featbin/copy-featsark:raw_mfcc_dev.10.arkark,t:-|headark存的试二进制文件,scp可以直接用cat命令看。*2.fst文件~/kaldi/tools/openfst-1.6.2/bin/fstprintL.fst|head-n10~/kaldi/t...

2019-04-13 20:18:29 447

原创 声纹识别笔记(二)提取ivector与PLDA流程概述以及最新模型

GMM-UBMGMM:均值、方差、权重UBM:共性特征i-vectorMAP说话人自适应m:UBM的均值(已知)s:把UBM针对特定说话人调整成GMM,GMM的均值(通过特征得到)T:训练得到w:特定说话人的ivector一般只更新均值,不更新方差DNN-based ivectord-vector输入之前的30帧和之后的10帧,总共4...

2019-04-11 22:25:52 3703

原创 声纹识别笔记(一)实验平台 常用特征 神经网络模型

发展源流: GMM -- ivector -- DNN背景介绍评价指标设置一个阈值,高于这个阈值的为True,低于则不接受用softmax输出一个概率Accuracy,则EER ~(1-ACC)/2。 e.g. Accuracy = 80% EER = (1-0.8)/2 = 10%实验结果越好,阈值选取越高,一般作为评价指标。EER是(一个分类器的)ROC曲线(接...

2019-04-11 21:34:03 3198

原创 kaldi中声纹识别ivector模型

1.数据准备:无论使用kaldi来做语音识别还是说话人识别,第一步就是数据准备,对于说话人识别来说,需要准备的几个文件为wav.scp,utt2spk,spk2utt这三个文件。对应的格式如下: 1.1 wav.scp有两列,第一列是key,这个可以一定要唯一;第二列是 wav的路径wavpath; 1.2 utt2spk也有两列,第一列是key,与wav.scp的第一列一样;...

2019-04-11 17:03:15 4578 2

原创 Kaldi在compute-vad-decision时,无法生成vad.scp

问题描述:在compute-vad-decision时,无法生成vad.scp,查看log中写到:compute-vad: command not found。Log中:解决方法:在path.sh中加入$KALDI_ROOT/src/ivectorbin/解决思路:找不到compute-vad这个可执行文件,检查src/ivectorbin中有没有这个文件 重新编译...

2019-04-10 12:47:28 734

原创 Kaldi 运行报错:fix_data_dir.sh: no utterances remained: not proceeding further.

The fix_data_dir.sh script eliminates some utterances if something is missing from one of the files needed (e.g. text, feats.scp, wav.scp) so if you had an empty or invalid wav.scp at input, it would...

2019-04-09 16:49:06 1851 2

离线去混响WPE算法代码

语言:Python WPE的离线实现,内容参考博文:https://blog.csdn.net/veritasalice/article/details/107417996 无需安装其他的包,仅调用numpy

2020-07-24

Kaldi的全部资料v07

Kaldi的全部资料v.07 新手入门kaldi的必备资料 有官方文档的中文翻译

2019-03-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除