语音
文章平均质量分 74
语音学,信号系统,语音识别,语音合成
倚剑笑紅尘
教练,我想学kaldi!
展开
-
conda虚拟环境操作
1. conda env list 或 conda info -e 查看当前存在哪些虚拟环境2. conda update conda 检查更新当前conda3. conda update --all 更新本地已安装的包4. conda create -n your_env_namepython=X.X(2.7、3.6等) anaconda 命令创建python版本为X.X、名字为y...原创 2020-02-15 20:07:55 · 517 阅读 · 0 评论 -
CTC+pytorch编译配置warp-CTC,以及问题解决
warp-CTC安装warp-CTC是百度开源的一个可以应用在CPU和GPU上高效并行的CTC代码库,对CTC算法进行了并行处理。warp-CTC安装:git clone https://github.com/SeanNaren/warp-ctc.gitcd warp-ctcmkdir build; cd buildcmake ..makecd ../pytorch_binding...原创 2020-02-12 00:05:24 · 2444 阅读 · 3 评论 -
./utils/subset_data_dir_tr_cv.shy脚本分析,用于划分训练集和验证集。
./utils/subset_data_dir_tr_cv.sh脚本分析这个脚本的作用是根据说话人来划分数据集,分为训练集和验证集。使用代码的结构如下:Usage: $0 [opts] <src-data> <train-data> <cv-data>src_data:指的就是原始的数据集合trn_data:指的是划分的训练集合cv_data:指的...原创 2019-12-15 17:01:38 · 657 阅读 · 0 评论 -
Linux join命令
Linux join命令用于将两个文件中,指定栏位内容相同的行连接起来。找出两个文件中,指定栏位内容相同的行,并加以合并,再输出到标准输出设备。语法:join [-i][-a<1或2>][-e<字符串>][-o<格式>][-t<字符>][-v<1或2>][-1<栏位>][-2<栏位>][--help][--v...原创 2019-12-15 15:38:10 · 1052 阅读 · 0 评论 -
lattice-copy脚本分析,将lattice压缩包解压后对其中的内容合并或删减后重新生成相应的lattice压缩包。
1.首先将lat.1.gz和lat.2.gz解压出来gunzip -c lat.1.gz >lat.1gunzip -c lat.2.gz >lat.22.将lat.1通过lattice-copy转化为相应的ark和scplattice-copy --write-compact=true ark:lat.1 ark,scp:lat1.ark,lat1.scplattice-...原创 2019-11-27 16:53:08 · 938 阅读 · 0 评论 -
utils/filter_scp.pl脚本功能分析
utils/filter_scp.pl脚本的功能首先看一这个脚本的输入输出文件: Usage: filter_scp.pl [--exclude] [-f] id_list [in.scp] > out.scpid_list:指的是话语ID的列表G0001T0001G0001S01010002G0001T0001G0001S01010003G0001T0001G0001S01...原创 2019-11-27 15:44:03 · 1557 阅读 · 1 评论 -
fix_date_dir.sh脚本代码分析
文章目录fix_date_dir.sh脚本的使用方法和目的:fix_date_dir.sh脚本的使用方法和目的:这个脚本主要是有助于确保数据目录中的各种文件得到正确排序和筛选,例如删除没有任何特征对应的语句(如果feats.scp存在) echo "Usage: utils/data/fix_data_dir.sh <data-dir>" echo "e.g.: util...原创 2019-11-17 23:23:38 · 1296 阅读 · 0 评论 -
区分性训练和mmi
文章目录互信息最大似然估计MLE(缺点)区分性训练DT和最大互信息MMI区分性训练缺点LatticeMMI的问题:MMI代码分析输入数据的介绍,以及特征的转化lattice boost搜集资料的思路:mmi -> DT -> mle -> ce -> 熵 -> 互信息互信息首先连接机器学习中的熵、条件熵、相对熵(KL散度)和交叉熵的概念:传送门信息熵是衡量随...原创 2019-11-14 10:15:41 · 1688 阅读 · 0 评论 -
make编译kaldi时候遇到的各种错误
文章目录第一个问题: aclocal-1.14: command not found第一个问题: aclocal-1.14: command not foundtools/openfst-1.6.7/missing: line 81: aclocal-1.14: command not foundWARNING: 'aclocal-1.14' is missing on your syst...原创 2019-11-11 13:14:38 · 2389 阅读 · 0 评论 -
kaldi学习笔记 -- 构造语言模型相关脚本 -- ami_train_lms.sh,utils/format_lm.sh
本文主要讲解kaldi语言模型构造脚本中关键指令的作用,输入和输出。原创 2019-11-05 16:00:53 · 868 阅读 · 2 评论 -
编译错误:python 2.7 is not the default python; default or create an bash alias for kaldi scripts to run
首先到./extra/check_dependencies中找到输出报错的那一句话:if which python2.7 >&/dev/null || which python2 >&/dev/null ; then echo "$0: python 2.7 is not the default python. You should either mak...原创 2019-11-04 15:05:10 · 781 阅读 · 0 评论 -
编译scws中文分词中遇到的一些问题
一、下载源码wget http://www.xunsearch.com/scws/down/scws-1.2.3.tar.bz2tar xvjf scws-1.2.3.tar.bz2二、执行配置脚本和编译具体选项参数执行 ./configure --help 查看。常用选项为:--prefix=指定安装目录cd scws-1.2.3mkdir build ./config...原创 2019-11-04 14:41:09 · 265 阅读 · 0 评论 -
kaldi理解WFST,HCLG,lattice
文章目录WFST,HCLGlatticeWFST,HCLG首先看博客:传送门同时可以参考如何去查看里面的各个文件:传送门了解HCLG.fst由哪四部分构成的,他们的构成的先后顺序是怎么样的,以及构成每一步的时候他们的输入输出文件是什么。HCLG.fst由四部分构成G:语言模型WFST,输入输出符号相同,实际是一个WFSA(acceptor接受机),为了方便与其它三个WFST进行操...原创 2019-11-03 16:38:39 · 10559 阅读 · 3 评论 -
Beam Search(集束搜索)算法
1.概念Beam Search(集束搜索):是一种启发式图搜索算法,在图的解空间比较大的情况下,为了减少搜索所占用的空间和时间,在每一步深度扩展的时候,剪掉一些质量比较差的结点,保留下一些质量较高的结点。好处:减少了空间消耗,并提高了时间效率。启发式搜索是利用问题拥有的启发信息来引导搜索,达到减少搜索范围、降低问题复杂度的目的2.过程Beam Search(集束搜索):使用广...原创 2019-11-01 11:41:07 · 7915 阅读 · 4 评论 -
Kaldi 单音素模型训练流程与总结
文章目录脚本原理总体的流程介绍:流程1.初始化单音素模型1.1gmm-init-mono.cc1.2compile-train-graphs.cc2.训练单音素模型2.1align-equal-compiled.cc和gmm-align-compiled2.2gmm-acc-stats-ali2.3gmm-sum-accs2.4gmm-est模型参数输出解释:提醒资料专业名词的解释脚本ais...原创 2019-09-21 23:06:31 · 3009 阅读 · 2 评论 -
Kaldi三音素GMM学习笔记
Kaldi三音素GMM学习笔记 三音素GMM与单音素GMM的主要差别在于决策树状态绑定,与GMM参数更新相关的原理、程序和类两者都是一样的。 在这个笔记中,我会首先介绍表示HMM的类HmmTopology和TransitionModel,然后介绍三音素GMM训练脚本train_deltas.sh用到的几个程序,这几个程序与单音素GMM的不同或者只在三音素GMM训练中出现。与GMM相关的其余...原创 2019-09-28 15:13:09 · 1052 阅读 · 2 评论 -
Kaldi决策树状态绑定学习笔记(一)
文章目录SLP第10.3 依赖于上下文的声学模型:三音子SLP第10.3 依赖于上下文的声学模型:三音子协同发音:发音器官为了预期下一个发音动作或保持上一个发音动作而进行的一种运动。和之前单音子的区别:单因子建立一个HMM模型,相应于音子的开头、中间和结尾的次因子,我们使用了三个发射状态。但事实类似“[eh]的开头”这种次因子的问题在于,一个音子在很大程度上会依赖于相邻的音子而发生变化...原创 2019-10-06 20:51:47 · 1275 阅读 · 0 评论 -
Kaldi决策树状态绑定学习笔记(二)
文章目录3.EventMap及其派生类、roots文件EventMapConstantEventMapSplitEventMapTableEventMapMap()roots文件shared or not-sharedsplit or not-split4.如何构建决策树?build-treeBuildTree()GetStubMap()SplitDecisionTree()参考:3.Even...原创 2019-10-07 15:07:23 · 525 阅读 · 0 评论 -
Kaldi入门教程 aishell脚本
Kaldi入门教程 aishell脚本文章目录Kaldi入门教程 aishell脚本@[toc]准备词典准备数据,分为test、dev、train集词典、语言文件准备,生成对应的数据关系训练语言模型使用语言模型生成有限状态机单音素训练构建单音素解码图:解码:分别针对开发集和测试集解码Veterbi 对齐其他模型的训练解码查看结果:准备词典用aishell为例子,首先运行aishell_...原创 2019-09-16 20:18:47 · 2033 阅读 · 0 评论