2019年04月_Dr. 卷心菜

11月 05月 04月 03月

原创将特征文件导入kaldi格式转换

将txt转成ark格式： ~/kaldi/src/featbin/copy-feats ark,t:train.txt ark:train.ark txt转化为ark查看ark文件：~/kaldi/src/featbin/copy-feats ark:raw_mfcc_train.1.ark ark,t:- | head生成scp文件： ~/k...

2019-04-30 09:44:25 380

转载 Kaldi中特征文件格式的转换

1、kaldi中的ark文件与htk中的mfcc文件的互相转换（1）、ark转mfcc 使用底层命令copy-feats-to-htkSave features as HTK files:每个发音会转化为一个对应的htk格式的特征文件，后缀可以自己定义用法...

2019-04-16 18:30:07 1174

原创 kaldi 用ivector计算plda出错

运行结果如下：===== FEATURES EXTRACTION =====steps/make_mfcc.sh --cmd run.pl --nj 1 data/train exp/make_mfcc/train mfccsteps/make_mfcc.sh: moving data/train/feats.scp to data/train/.backupsteps/make...

2019-04-13 21:53:41 1583 3

转载 Kaldi 查看不同文件用到的命令

* 1.ark,scp文件~/kaldi/src/featbin/copy-featsark:raw_mfcc_dev.10.arkark,t:-|headark存的试二进制文件，scp可以直接用cat命令看。*2.fst文件~/kaldi/tools/openfst-1.6.2/bin/fstprintL.fst|head-n10~/kaldi/t...

2019-04-13 20:18:29 447

原创声纹识别笔记（二）提取ivector与PLDA流程概述以及最新模型

GMM-UBMGMM：均值、方差、权重UBM：共性特征i-vectorMAP说话人自适应m：UBM的均值（已知）s：把UBM针对特定说话人调整成GMM，GMM的均值（通过特征得到）T：训练得到w：特定说话人的ivector一般只更新均值，不更新方差DNN-based ivectord-vector输入之前的30帧和之后的10帧，总共4...

2019-04-11 22:25:52 3703

原创声纹识别笔记（一）实验平台常用特征神经网络模型

发展源流： GMM -- ivector -- DNN背景介绍评价指标设置一个阈值，高于这个阈值的为True,低于则不接受用softmax输出一个概率Accuracy，则EER ~（1-ACC）/2。 e.g. Accuracy = 80% EER = (1-0.8)/2 = 10%实验结果越好，阈值选取越高，一般作为评价指标。EER是（一个分类器的）ROC曲线（接...

2019-04-11 21:34:03 3198

原创 kaldi中声纹识别ivector模型

1.数据准备：无论使用kaldi来做语音识别还是说话人识别，第一步就是数据准备，对于说话人识别来说，需要准备的几个文件为wav.scp，utt2spk，spk2utt这三个文件。对应的格式如下： 1.1 wav.scp有两列，第一列是key，这个可以一定要唯一；第二列是 wav的路径wavpath； 1.2 utt2spk也有两列，第一列是key，与wav.scp的第一列一样；...

2019-04-11 17:03:15 4578 2

原创 Kaldi在compute-vad-decision时，无法生成vad.scp

问题描述：在compute-vad-decision时，无法生成vad.scp，查看log中写到：compute-vad: command not found。Log中：解决方法：在path.sh中加入$KALDI_ROOT/src/ivectorbin/解决思路：找不到compute-vad这个可执行文件，检查src/ivectorbin中有没有这个文件重新编译...

2019-04-10 12:47:28 734

原创 Kaldi 运行报错：fix_data_dir.sh: no utterances remained: not proceeding further.

The fix_data_dir.sh script eliminates some utterances if something is missing from one of the files needed (e.g. text, feats.scp, wav.scp) so if you had an empty or invalid wav.scp at input, it would...

2019-04-09 16:49:06 1851 2

离线去混响WPE算法代码

语言：Python WPE的离线实现，内容参考博文：https://blog.csdn.net/veritasalice/article/details/107417996 无需安装其他的包，仅调用numpy

2020-07-24

Kaldi的全部资料v07

Kaldi的全部资料v.07 新手入门kaldi的必备资料有官方文档的中文翻译

2019-03-18

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人