- 博客(9)
- 资源 (2)
- 收藏
- 关注
原创 将特征文件导入kaldi格式转换
将txt转成ark格式: ~/kaldi/src/featbin/copy-feats ark,t:train.txt ark:train.ark txt转化为ark查看ark文件:~/kaldi/src/featbin/copy-feats ark:raw_mfcc_train.1.ark ark,t:- | head生成scp文件: ~/k...
2019-04-30 09:44:25 380
转载 Kaldi中特征文件格式的转换
1、kaldi中的ark文件与htk中的mfcc文件的互相转换(1)、ark转mfcc 使用底层命令copy-feats-to-htkSave features as HTK files:每个发音会转化为一个对应的htk格式的特征文件,后缀可以自己定义用法...
2019-04-16 18:30:07 1174
原创 kaldi 用ivector计算plda出错
运行结果如下:===== FEATURES EXTRACTION =====steps/make_mfcc.sh --cmd run.pl --nj 1 data/train exp/make_mfcc/train mfccsteps/make_mfcc.sh: moving data/train/feats.scp to data/train/.backupsteps/make...
2019-04-13 21:53:41 1583 3
转载 Kaldi 查看不同文件用到的命令
* 1.ark,scp文件~/kaldi/src/featbin/copy-featsark:raw_mfcc_dev.10.arkark,t:-|headark存的试二进制文件,scp可以直接用cat命令看。*2.fst文件~/kaldi/tools/openfst-1.6.2/bin/fstprintL.fst|head-n10~/kaldi/t...
2019-04-13 20:18:29 447
原创 声纹识别笔记(二)提取ivector与PLDA流程概述以及最新模型
GMM-UBMGMM:均值、方差、权重UBM:共性特征i-vectorMAP说话人自适应m:UBM的均值(已知)s:把UBM针对特定说话人调整成GMM,GMM的均值(通过特征得到)T:训练得到w:特定说话人的ivector一般只更新均值,不更新方差DNN-based ivectord-vector输入之前的30帧和之后的10帧,总共4...
2019-04-11 22:25:52 3703
原创 声纹识别笔记(一)实验平台 常用特征 神经网络模型
发展源流: GMM -- ivector -- DNN背景介绍评价指标设置一个阈值,高于这个阈值的为True,低于则不接受用softmax输出一个概率Accuracy,则EER ~(1-ACC)/2。 e.g. Accuracy = 80% EER = (1-0.8)/2 = 10%实验结果越好,阈值选取越高,一般作为评价指标。EER是(一个分类器的)ROC曲线(接...
2019-04-11 21:34:03 3198
原创 kaldi中声纹识别ivector模型
1.数据准备:无论使用kaldi来做语音识别还是说话人识别,第一步就是数据准备,对于说话人识别来说,需要准备的几个文件为wav.scp,utt2spk,spk2utt这三个文件。对应的格式如下: 1.1 wav.scp有两列,第一列是key,这个可以一定要唯一;第二列是 wav的路径wavpath; 1.2 utt2spk也有两列,第一列是key,与wav.scp的第一列一样;...
2019-04-11 17:03:15 4578 2
原创 Kaldi在compute-vad-decision时,无法生成vad.scp
问题描述:在compute-vad-decision时,无法生成vad.scp,查看log中写到:compute-vad: command not found。Log中:解决方法:在path.sh中加入$KALDI_ROOT/src/ivectorbin/解决思路:找不到compute-vad这个可执行文件,检查src/ivectorbin中有没有这个文件 重新编译...
2019-04-10 12:47:28 734
原创 Kaldi 运行报错:fix_data_dir.sh: no utterances remained: not proceeding further.
The fix_data_dir.sh script eliminates some utterances if something is missing from one of the files needed (e.g. text, feats.scp, wav.scp) so if you had an empty or invalid wav.scp at input, it would...
2019-04-09 16:49:06 1851 2
离线去混响WPE算法代码
2020-07-24
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人