KALDI工具
文章平均质量分 63
落雪snowflake
未来的博士!正在努力申请英国Phd!
展开
-
KALDI-SV note 目录初始化结构
文件名 说明 创建 备注 conf 配置目录 手动 特征配置文件 local 脚本目录 手动 特定工程所需脚本 sid 脚本目录 符号链接 一类工程所需脚本 steps 脚本目录 符号链接 KALDI提供数据处理工具 utils 脚本目录 符号链接 KALDI提供模型工具...转载 2018-11-06 19:34:33 · 166 阅读 · 0 评论 -
Kaldi类的输入/输出风格--------------------------------此页翻译
http://kaldi-asr.org/doc/io.html翻译 2018-11-12 20:57:22 · 444 阅读 · 0 评论 -
一些kaldi常用的术语和命令(二)
脚本运行前当前目录结构(data是新生成的目录)• local : 包含当前数据的目录• train : 数据库中分离出来的训练数据.• test_* : 数据库中分离出来的测试数据.有些文件不是通过Kaldi得到的,而是通过OpenFst自己准备得到,比如•lexicon.txt : 词典文件•silence.txt : 包含哪个音素是静音的,哪个音素不是静音的信息到...原创 2018-11-14 20:05:36 · 3515 阅读 · 0 评论 -
Kaldi-dnn 学习01
1. Kaldi 中实现的 dnn 共 4 种: a. nnet1 - 基于 Karel's 的实现,特点:简单,仅支持单 GPU, 由 Karel 维护 b. nnet2 - 基于 Daniel Povey p-norm 的实现,特点:灵活,支持多 GPU、CPU,由 Daniel 维护 c. nnet3 - nnet2 的改进,由 Daniel 维护 d...原创 2018-11-16 16:03:59 · 896 阅读 · 0 评论 -
kaldi中声纹识别例子大概步骤综述
如何利用kaldi搭建说话人识别的例子。仅仅是搭建,具体的很多参数的调整需要大家根据数据集的不同慢慢调整。 数据准备:无论使用kaldi来做语音识别还是说话人识别,第一步就是数据准备,对于说话人识别来说,需要准备的几个文件为wav.scp,utt2spk,spk2utt这三个文件。对应的格式如下: 1.1 wav.scp有两列,第一列是key,这个可以一定要唯一;第二列是 wav的路径w...原创 2018-11-22 18:31:47 · 4826 阅读 · 3 评论 -
KALDI脚本文件解释
Kaldi脚本运行的说明:http://kaldi-asr.org/doc/tutorial_running.html有一个例子是从RM数据集创建训练集和测试集(/export/corpora5/LDC/LDC93S3A/rm_comp是数据集路径) local/rm_data_prep.sh需要自己编写,运行命令local/rm_data_prep.sh /export/corpora...原创 2018-11-18 10:33:54 · 2263 阅读 · 0 评论 -
KALDI编码风格
Kaldi编码风格当开始编写Kaldi工具包的最终版本时,我们决定使用OpenFst作为C ++库。为了与OpenFst保持一致,我们决定在大多数方面使用相同的编码风格。从查看代码可以明显看出Kaldi编码风格的许多方面。要点包括:关于命令命名的规则,例如MyTypeName,MyFunction,my_class_member_var_,my_struct_member,KALD...原创 2018-11-18 10:43:32 · 365 阅读 · 0 评论 -
解析命令行选项
介绍ParseOptions类处理通过argc和argv给main()的命令行选项的解析。首先,我们举例说明如何从命令行调用典型的Kaldi程序: gmm-align --transition-scale = 10.0 --beam = 75 \ exp / mono / tree exp / mono / 30.mdl data / L.fst \ 'ar...原创 2018-11-18 10:57:00 · 905 阅读 · 0 评论 -
其他Kaldi公用事业
本页概述了我们在Kaldi代码中使用的各种实用功能。这排除了在各自部分中处理过的重要实用程序,包括矩阵库,I / O,日志记录和错误报告以及命令行解析。文字工具在text-utils.h中有各种用于操作字符串的函数,主要用于解析。重要的包括模板化函数ConvertStringToInteger(),以及为float和double定义的重载ConvertStringToReal()函数。...原创 2018-11-18 11:01:47 · 194 阅读 · 0 评论 -
kaldi :: nnet2命名空间参考
text-utils.h File Reference#include <errno.h>#include <string>#include <algorithm>#include <map>#include <set>#include <vector>#include <limits>#include &qu原创 2018-11-18 11:21:20 · 737 阅读 · 0 评论 -
关于声纹识别数据集VoxCeleb下载问题
虽然这个数据集是开源的http://www.robots.ox.ac.uk/~vgg/data/voxceleb/,但是需要申请,下面讲一下如何申请以及它所包含的内容;打开网址http://www.robots.ox.ac.uk/~vgg/data/voxceleb/,找到download然后开始点击voxceleb1或者voxceleb2或者Models中的任何一个(j举例:这里点击就...原创 2018-11-12 20:30:02 · 8415 阅读 · 24 评论 -
一些kaldi常用的术语和命令(一)
/egs里一般存放执行的脚本,.sh文件,讲了每一步要执行什么操作,而真正的算法程序部分,在/src里的.cc、.h文件里。 archive(.ark)、script(.scp) :是表格(table)一个‘表’就是一组有序的事物,前面是识别字符串(如句子的id),一个‘表’不是一个c++的对象,因为对应不同的需求(写入、迭代、随机读入)我们分别有c++对象来读入数据。Table有两种形式:...原创 2018-11-14 16:13:52 · 4484 阅读 · 1 评论 -
KALDI之aishell之v1模型后续3
#extract ivectorsid/extract_ivectors.sh --cmd "$train_cmd" --nj 10 \ exp/extractor_1024 data/train exp/ivector_train_1024该脚本为一组话语,给定的特征和训练有素的iVector提取器提取iVectors。#开始配置部分。NJ= 30num_threads = 1...原创 2018-11-09 14:56:29 · 2108 阅读 · 2 评论 -
ivector-extractor-testcc文件读书笔记
// ivector/ivector-extractor-test.cc// Copyright 2013 Daniel Povey// See ../../COPYING for clarification regarding multiple authors//// Licensed under the Apache License, Version 2.0 (the "Lic...原创 2018-11-09 21:06:10 · 358 阅读 · 0 评论 -
train plda脚本
这个是嵌套命令先要执行ivector 然后标准输出一个东西。。然后给train_cmd 用 这里面第一个要执行的命令: ivector-normalize-length, 第二个命令是: ivector-compute-plda, 第三个命令: train的命令ark = archive ark:-是标准输入输出的意思...原创 2018-11-09 21:35:26 · 205 阅读 · 0 评论 -
KALDI之aishell模型说话人识别之V1
1.首先,成功安装kaldi在服务器上,用git clone那种方式安装(和在本地Unbuntu乌班图环境安装没区别)。2数据准备部分然后进入目录cd egs/aishell/V1 2.1首先改cmd的配置:vim cmd.sh1改为:export train_cmd=run.pl #"queue.pl --mem 2G":wq保存后。2...原创 2018-11-07 20:19:51 · 3951 阅读 · 5 评论 -
KALDI之aishell之V1模型续进行VAD检测
上面特征提取貌似没完事了VAD是语音激活检测算法,用于判断什么时候有语音输出,什么时候是静音状态。下面进入/kaldi-trunk/egs/aishell/v1/sidvim compute_vad_decision.sh第22行显示 echo "e.g.: $0 data/train exp/make_vad mfcc" 然后在/kaldi-trunk/egs/ai...原创 2018-11-07 21:21:51 · 2419 阅读 · 0 评论 -
关于PLDA在kaldi中的基础知识和代码完整版
理论基础知识LDA用来提取线性特征,这种特征的目标在于最大化between-class separation以及最小化within-class sepration。LDA可以给训练数据拟合一个高斯混合模型:用x表示observable sample,用y表示the latent variable,则类条件概率可以表示为 这种混合模型只能表示有限的K类,如果想拓...原创 2018-11-11 20:02:48 · 3189 阅读 · 1 评论 -
KALDI中声纹识别学习流程及资源
KALDI工具包中的例子首先最基础的就是egs/aishell/V1,先跑通它,并理解代码和基础理论知识。egs/sre08 REMAD.TXT系统开发所需的数据(除了所描述的测试数据之外) 在../README.txt)中,由Fisher,过去的NIST SRE和Switchboard组成 蜂窝。 你可以只用Fisher的一部分就可以了。 ...原创 2018-11-11 20:38:30 · 6152 阅读 · 3 评论 -
KALDI之aishell之V1模型续4(最终的结果)
成功结束了aishell之V1模型:eer=0.049%sid/extract_ivectors.sh --cmd run.pl --mem 4G --nj 10 exp/extractor_male data/test/enroll exp/ivector_enroll_1024sid/extract_ivectors.sh: extracting iVectorssid/ex...原创 2018-11-11 20:55:18 · 2311 阅读 · 3 评论 -
KALDI中aishell之V1模型后续2
根据run.sh文件中,下一步执行utils中 fix_data_dir.sh的脚本。步骤同上面一样找 fix_data_dir.sh中的eg部分,然后在V1目录下执行:./utils/data/fix_data_dir.sh data/train结果如下根据run.sh文件中,下一步执行sid中 train_diag_ubm.sh的脚本 ./sid/train_diag...原创 2018-11-08 19:04:33 · 1850 阅读 · 1 评论 -
特征提取I-VECTOR算法源码01
#include <algorithm> #include "ivector/agglomerative-clustering.h" namespace kaldi { void AgglomerativeClusterer::Cluster() { KALDI_VLOG(2) << "Initializing cluster as...原创 2018-11-26 20:04:54 · 2240 阅读 · 5 评论