倚剑笑紅尘-CSDN博客

原创 kaldi理解WFST，HCLG，lattice

文章目录WFST，HCLGlatticeWFST，HCLG首先看博客：传送门同时可以参考如何去查看里面的各个文件：传送门了解HCLG.fst由哪四部分构成的，他们的构成的先后顺序是怎么样的，以及构成每一步的时候他们的输入输出文件是什么。HCLG.fst由四部分构成G：语言模型WFST，输入输出符号相同，实际是一个WFSA（acceptor接受机），为了方便与其它三个WFST进行操...

2019-11-03 16:38:39 10250 3

文章目录3.EventMap及其派生类、roots文件EventMapConstantEventMapSplitEventMapTableEventMapMap()roots文件shared or not-sharedsplit or not-split4.如何构建决策树？build-treeBuildTree()GetStubMap()SplitDecisionTree()参考：3.Even...

2019-10-07 15:07:23 498

原创 Kaldi决策树状态绑定学习笔记（一）

文章目录SLP第10.3 依赖于上下文的声学模型：三音子SLP第10.3 依赖于上下文的声学模型：三音子协同发音：发音器官为了预期下一个发音动作或保持上一个发音动作而进行的一种运动。和之前单音子的区别：单因子建立一个HMM模型，相应于音子的开头、中间和结尾的次因子，我们使用了三个发射状态。但事实类似“[eh]的开头”这种次因子的问题在于，一个音子在很大程度上会依赖于相邻的音子而发生变化...

2019-10-06 20:51:47 968

原创 Kaldi三音素GMM学习笔记

Kaldi三音素GMM学习笔记　　三音素GMM与单音素GMM的主要差别在于决策树状态绑定，与GMM参数更新相关的原理、程序和类两者都是一样的。　　在这个笔记中，我会首先介绍表示HMM的类HmmTopology和TransitionModel，然后介绍三音素GMM训练脚本train_deltas.sh用到的几个程序，这几个程序与单音素GMM的不同或者只在三音素GMM训练中出现。与GMM相关的其余...

2019-09-28 15:13:09 1035 2

原创 Kaldi 单音素模型训练流程与总结

文章目录脚本原理总体的流程介绍：流程1.初始化单音素模型1.1gmm-init-mono.cc1.2compile-train-graphs.cc2.训练单音素模型2.1align-equal-compiled.cc和gmm-align-compiled2.2gmm-acc-stats-ali2.3gmm-sum-accs2.4gmm-est模型参数输出解释：提醒资料专业名词的解释脚本ais...

2019-09-21 23:06:31 2926 2

原创 Kaldi入门教程 aishell脚本

Kaldi入门教程 aishell脚本文章目录Kaldi入门教程 aishell脚本@[toc]准备词典准备数据，分为test、dev、train集词典、语言文件准备，生成对应的数据关系训练语言模型使用语言模型生成有限状态机单音素训练构建单音素解码图：解码：分别针对开发集和测试集解码Veterbi 对齐其他模型的训练解码查看结果：准备词典用aishell为例子，首先运行aishell_...

2019-09-16 20:18:47 1816

原创 TensorFlow2.0学习笔记(二）

TensorFlow2.0学习笔记(二）基础运算API的使用tf.constant 创建一个常量:简单运算，加，平方，转置后相乘：numpy conversion:string类型的变量以及数组，如何初始化，如何查看长度：ragged tensorragged tensor 拼接：ragged tensor转化为tensorsparse tensor乘法、矩阵相乘变量变量的赋值操作自定义损失函数...

2020-04-10 16:25:47 1136 3

原创 TensorFlow2.0学习笔记(一）

这里写目录标题数据读取和展示模型构建数据读取和展示首先我们导入相关的头文件和库import matplotlib as mplimport matplotlib.pyplot as plt%matplotlib inlineimport numpy as npimport sklearnimport pandas as pdimport osimport sysimport ...

2020-04-09 01:32:24 1733

原创 conda虚拟环境操作

1. conda env list 或 conda info -e 查看当前存在哪些虚拟环境2. conda update conda 检查更新当前conda3. conda update --all 更新本地已安装的包4. conda create -n your_env_namepython=X.X（2.7、3.6等） anaconda 命令创建python版本为X.X、名字为y...

2020-02-15 20:07:55 488

原创 CTC+pytorch编译配置warp-CTC,以及问题解决

warp-CTC安装warp-CTC是百度开源的一个可以应用在CPU和GPU上高效并行的CTC代码库，对CTC算法进行了并行处理。warp-CTC安装：git clone https://github.com/SeanNaren/warp-ctc.gitcd warp-ctcmkdir build; cd buildcmake ..makecd ../pytorch_binding...

2020-02-12 00:05:24 2364 3

原创 ./utils/subset_data_dir_tr_cv.shy脚本分析，用于划分训练集和验证集。

./utils/subset_data_dir_tr_cv.sh脚本分析这个脚本的作用是根据说话人来划分数据集，分为训练集和验证集。使用代码的结构如下：Usage: $0 [opts] <src-data> <train-data> <cv-data>src_data:指的就是原始的数据集合trn_data：指的是划分的训练集合cv_data：指的...

2019-12-15 17:01:38 627

原创 Linux join命令

Linux join命令用于将两个文件中，指定栏位内容相同的行连接起来。找出两个文件中，指定栏位内容相同的行，并加以合并，再输出到标准输出设备。语法：join [-i][-a<1或2>][-e<字符串>][-o<格式>][-t<字符>][-v<1或2>][-1<栏位>][-2<栏位>][--help][--v...

2019-12-15 15:38:10 1016

原创 lattice-copy脚本分析，将lattice压缩包解压后对其中的内容合并或删减后重新生成相应的lattice压缩包。

1.首先将lat.1.gz和lat.2.gz解压出来gunzip -c lat.1.gz >lat.1gunzip -c lat.2.gz >lat.22.将lat.1通过lattice-copy转化为相应的ark和scplattice-copy --write-compact=true ark:lat.1 ark,scp:lat1.ark,lat1.scplattice-...

2019-11-27 16:53:08 902

原创 utils/filter_scp.pl脚本功能分析

utils/filter_scp.pl脚本的功能首先看一这个脚本的输入输出文件： Usage: filter_scp.pl [--exclude] [-f] id_list [in.scp] > out.scpid_list：指的是话语ID的列表G0001T0001G0001S01010002G0001T0001G0001S01010003G0001T0001G0001S01...

2019-11-27 15:44:03 1492 1

原创 fix_date_dir.sh脚本代码分析

文章目录fix_date_dir.sh脚本的使用方法和目的：fix_date_dir.sh脚本的使用方法和目的：这个脚本主要是有助于确保数据目录中的各种文件得到正确排序和筛选，例如删除没有任何特征对应的语句（如果feats.scp存在） echo "Usage: utils/data/fix_data_dir.sh <data-dir>" echo "e.g.: util...

2019-11-17 23:23:38 1209

原创区分性训练和mmi

文章目录互信息最大似然估计MLE（缺点）区分性训练DT和最大互信息MMI区分性训练缺点LatticeMMI的问题：MMI代码分析输入数据的介绍，以及特征的转化lattice boost搜集资料的思路：mmi -> DT -> mle -> ce -> 熵 -> 互信息互信息首先连接机器学习中的熵、条件熵、相对熵(KL散度)和交叉熵的概念：传送门信息熵是衡量随...

2019-11-14 10:15:41 1473

原创 make编译kaldi时候遇到的各种错误

文章目录第一个问题： aclocal-1.14: command not found第一个问题： aclocal-1.14: command not foundtools/openfst-1.6.7/missing: line 81: aclocal-1.14: command not foundWARNING: 'aclocal-1.14' is missing on your syst...

2019-11-11 13:14:38 2297

原创 kaldi学习笔记 -- 构造语言模型相关脚本 -- ami_train_lms.sh，utils/format_lm.sh

本文主要讲解kaldi语言模型构造脚本中关键指令的作用，输入和输出。

2019-11-05 16:00:53 838 2

原创编译错误：python 2.7 is not the default python； default or create an bash alias for kaldi scripts to run

首先到./extra/check_dependencies中找到输出报错的那一句话：if which python2.7 >&/dev/null || which python2 >&/dev/null ; then echo "$0: python 2.7 is not the default python. You should either mak...

2019-11-04 15:05:10 742

原创编译scws中文分词中遇到的一些问题

一、下载源码wget http://www.xunsearch.com/scws/down/scws-1.2.3.tar.bz2tar xvjf scws-1.2.3.tar.bz2二、执行配置脚本和编译具体选项参数执行 ./configure --help 查看。常用选项为：--prefix=指定安装目录cd scws-1.2.3mkdir build ./config...

2019-11-04 14:41:09 249

原创 Beam Search（集束搜索）算法

1.概念Beam Search（集束搜索）：是一种启发式图搜索算法，在图的解空间比较大的情况下，为了减少搜索所占用的空间和时间，在每一步深度扩展的时候，剪掉一些质量比较差的结点，保留下一些质量较高的结点。好处：减少了空间消耗，并提高了时间效率。启发式搜索是利用问题拥有的启发信息来引导搜索，达到减少搜索范围、降低问题复杂度的目的2.过程Beam Search（集束搜索）：使用广...

2019-11-01 11:41:07 7495 4

原创 python实现李航第十章HMM算法的前向、后向、维特比算法

python实现李航第十章HMM算法的前向、后向、维特比算法前向算法后向算法维特比算法前向算法理论部分参考链接：前向算法问题：给出 λ\lambdaλ,求P(O∣λ)P(O|\lambda)P(O∣λ)以下只给结论，不给具体推导：首先假设一个α\alphaααt(i)=P(o1...,ot,it=qi∣λ)\alpha{_t}{(i)}=P(o{_1}...,o{_t},i{_t...

2019-09-08 22:45:39 667

原创 Github已经创建，希望大家能关注一下

github博客主页本人2016级瓜大本科生，大学前三年主要参与ACM竞赛，痴迷于各种算法竞赛题。至2019年暑假确定留校读研究生，以后将从事语音识别方面的工程项目，励志成为一个语音识别的全栈工程师，听从师兄的教诲，不仅仅只学习现在的热门——深度学习训练模型，同时也打算认真去学习语音识别传统的语音的处理，信号的处理等，提高自己各方面的能力。以后github上会陆续更新一些论文的个人理解...

2019-08-13 19:01:11 158

原创先验概率、后验概率、似然估计，似然函数、贝叶斯公式

先验概率、后验概率与似然估计本文假设大家都知道什么叫条件概率了（P(A|B)表示在B事件发生的情况下，A事件发生的概率）。先验概率和后验概率教科书上的解释总是太绕了。其实举个例子大家就明白这两个东西了。假设我们出门堵车的可能因素有两个（就是假设而已，别当真）：车辆太多和交通事故。堵车的概率就是先验概率。那么如果我们出门之前我们听到新闻说今天路上出了个交通事故，那么我们想算一...

2019-08-02 13:41:52 439

原创梯度消失和梯度爆炸原因推导

什么导致了消失的梯度问题？也就是在深度神经网络中的所谓的梯度不稳定性为了弄清楚为何会出现消失的梯度，来看看一个极简单的深度神经网络：每一层都只有一个单一的神经元。下图就是有三层隐藏层的神经网络：简单的深度神经网络这里，是权重，而是偏差，C 则是某个代价函数。回顾一下，从第 j 个神经元的输出，其中是通常的 sigmoid 函数，而是神经元的带权输入。我已经在最后...

2019-05-06 15:21:31 1153

原创常用的激活函数

引言本文的内容包括几个部分：1.什么是激活函数？2.激活函数的用途（为什么需要激活函数）？3.有哪些激活函数，都有什么性质和特点？4.sigmoid ，ReLU， softmax 的比较5.应用中如何选择合适的激活函数？什么是激活函数？首先要了解神经网络的基本模型。单一神经元模型如下图所示。神经网络中的每个神经元节点接受上一层神经元的输出值作为本神经元的输入值，并...

2019-05-06 00:14:10 647

原创 VGGNet论文阅读总结

首先论文中英文对照链接：传送门概述VGGNet这篇论文最主要的贡献在于从网络深度这一角度出发，对卷积神经网络进行了改进。非常详尽的评估了网络深度所带来的影响，证明了网络的深度对于性能的提升具有举足轻重的作用。而且文中训练的两个16层和19层的网络由于其强大的泛化能力，在随后得到了非常广泛的应用。VGGNet的主要特点在于：(1)网络很深；(2)卷积层中使用的卷积核很小，且都是3*3的卷积核...

2019-04-28 23:59:44 1592

原创吴恩达深度学习第五章序列模型——第三周序列模型和注意力机制

序列模型和注意力机制Seq2Seq 模型Seq2Seq（Sequence-to-Sequence）模型能够应用于机器翻译、语音识别等各种序列到序列的转换问题。一个 Seq2Seq 模型包含编码器（Encoder）和解码器（Decoder）两部分，它们通常是两个不同的 RNN。如下图所示，将编码器的输出作为解码器的输入，由解码器负责输出正确的翻译结果。提出 Seq2Seq 模型的相关...

2019-04-21 00:27:40 996

原创吴恩达深度学习第五章序列模型——第二周自然语言处理与词嵌入

词嵌入one-hot 向量将每个单词表示为完全独立的个体，不同词向量都是正交的，因此单词间的相似度无法体现。换用特征化表示方法能够解决这一问题。我们可以通过用语义特征作为维度来表示一个词，因此语义相近的词，其词向量也相近。将高维的词嵌入“嵌入”到一个二维空间里，就可以进行可视化。常用的一种可视化算法是 t-SNE 算法。在通过复杂而非线性的方法映射到二维空间后，每个词会根据语义和相关程...

2019-04-20 15:07:47 565

原创吴恩达深度学习第五章序列模型——第一周循环序列模型

循环序列模型自然语言和音频都是前后相互关联的数据，对于这些序列数据需要使用循环神经网络（Recurrent Neural Network，RNN）来进行处理。使用 RNN 实现的应用包括下图中所示：数学模型对于一个序列数据x，用符号x〈t〉来表示这个数据中的第t个元素，用y〈t〉来表示第t个标签，用Tx和Ty来表示输入和输出的长度。对于一段音频，元素可能是其中的几...

2019-04-19 11:51:05 512

原创吴恩达深度学习第四章卷积神经网络——第四周特殊应用：人脸识别和神经风格转换

特殊应用：人脸识别和神经风格转换人脸识别人脸验证（Face Verification）和人脸识别（Face Recognition）的区别：人脸验证：一般指一个一对一问题，只需要验证输入的人脸图像是否与某个已知的身份信息对应；人脸识别：一个更为复杂的一对多问题，需要验证输入的人脸图像是否与多个已知身份信息中的某一个匹配。一般来说，由于需要匹配的身份信息更多导致错误率增加，人脸识别...

2019-04-18 00:21:49 625

原创吴恩达深度学习第四章卷积神经网络——第三周目标检测

定义目标检测是计算机视觉领域中一个新兴的应用方向，其任务是对输入图像进行分类的同时，检测图像中是否包含某些目标，并对他们准确定位并标识。目标定位定位分类问题不仅要求判断出图片中物体的种类，还要在图片中标记出它的具体位置，用边框（Bounding Box，或者称包围盒）把物体圈起来。一般来说，定位分类问题通常只有一个较大的对象位于图片中间位置；而在目标检测问题中，图片可以含有多个对象，甚...

2019-04-14 13:35:52 1399

原创吴恩达深度学习第四章卷积神经网络——第二周深度卷积网络：实例探究

讲到的经典 CNN 模型包括：LeNet-5 AlexNet VGG此外还有 ResNet（Residual Network，残差网络），以及 Inception Neural Network。经典卷积网络LeNet-5特点：LeNet-5 针对灰度图像而训练，因此输入图片的通道数为 1。该模型总共包含了约 6 万个参数，远少于标准神经网络所需。典型的 LeN...

2019-04-13 17:06:02 813

原创吴恩达深度学习第四章卷积神经网络——第一周卷积神经网络基础

1.计算机视觉计算机视觉（Computer Vision）的高速发展标志着新型应用产生的可能，例如自动驾驶、人脸识别、创造新的艺术风格。人们对于计算机视觉的研究也催生了很多机算机视觉与其他领域的交叉成果。一般的计算机视觉问题包括以下几类：图片分类（Image Classification）；目标检测（Object detection）；神经风格转换（Neural Style Tra...

2019-04-12 18:43:17 599

原创吴恩达深度学习第三章第二周——机器学习策略（2）

一、进行误差分析以猫分类器为例，假设我们的模型表现的还不错，但是依旧存在误差，预测后错误标记的数据中有一部分狗图片被错误的标记成了猫。我们不能盲目的直接去训练狗的分类器，以能更好的区分猫和狗。我们首先需要去对错误的样本进行分析，假如错误分类的100个样本中，只有5个狗样本被错误的标记成了猫，那么经过你的完善，你的模型能够区分猫和狗，你的效率也只是提高了5%。所以对误差进行分析就显得比较重要...

2019-04-11 20:32:53 465

原创吴恩达深度学习第三章第一周——机器学习策略

一、为什么是ML策略（机器学习策略）假如我们在构建一个喵咪分类器，数据集就是上面几个图，训练之后准确率达到90%。虽然看起来挺高的，但是这显然并不具一般性，因为数据集太少了。那么此时可以想到的ML策略有哪些呢？总结如下：收集更多的数据收集更多不同的训练集结合梯度下降训练算法更长时间尝试Adam算法尝试更大的网路尝试小一点的网络试着用一下dropout算法加上...

2019-04-11 10:06:49 269

原创吴恩达深度学习第二章第二周——超参数调试、Batch正则化和程序框架

一、调试处理week2中提到有如下的超参数：α 学习效率步长 hidden units 隐藏单元 mini-batch size 小批量梯度下降的步长 β 指数加权平均的系数 layers 隐藏层的层数 learning rate decay 学习效率的衰减率 β1,β2,ε adam算法的系数（一般情况β1=0.9，β2=0.999，ε=10^...

2019-04-10 11:40:01 191

原创吴恩达深度学习第二章第二周——各种梯度优化算法的总结

在这一周的视频中，讲了很多的优化算法，而且名字多比较难记，有些算法又有类似之处，为了之后不混淆，决定特地整理下每周的各种梯度优化算法，做一个总结。于4.8日进行更新：在四月初写完这篇博客，在月底阅读关于VGG的论文时，由于其需要用到带动量的小批量梯度下降，所以由来重新复习相应的知识点，并找了一篇将梯度算法优缺点整理较为完善的文章作为参考：传送门1. Mini-batch（小批量）梯度下降法...

2019-04-09 12:09:29 337

原创吴恩达深度学习第二章第一周——Dropout正则化的个人理解

学习了吴恩达机器学习第二章改善深层神经网络：超参数调试、正则化以及优化的第一周之后发现对其中的部分知识仍然不是很理解，因此打算对其中的一些难点重新去整理。又因为所有的内容太多，所以这边我打算只做难点的整理。1) Dropout("随机失活")操作过程1.每层每个节点以某一概率(这里以50%为例)被选中为需要删除的节点(如下图中标上X的节点)2.被选中为删除的节点，不仅要删除节点，与...

2019-04-08 15:23:50 594 1

原创机器学习第十九章——应用举例：照片OCR

一. Photo OCR1. Problem Description and Pipeline 问题描述图像文字识别应用所作的事是，从一张给定的图片中识别文字。这比从一份扫描文档中识别文字要复杂的多为了完成这样的工作，需要采取如下步骤：文字侦测（Text detection）——将图片上的文字与其他环境对象分离开来字符切分（Character segmentation）——将...

2019-04-05 22:20:52 356

空空如也

空空如也