2016年06月_jinmingz

12月 11月 10月 09月 08月 07月 06月 05月 04月 02月 01月

转载语音识别中的声学模型（AM）和语言模型(LM)

本文主要受参考自： http://blog.csdn.net/by21010/article/details/51506292 以及： https://www.zhihu.com/question/35833334最近看essen源码，感觉对于ASR 的一下之前的比较基础的算法很生疏，在知乎上看到这个链接，感觉讲的比较通俗易懂，拿来再理解一下。decoder是根据声学模型和语音模型，将

2016-06-29 23:12:01 43043 1

原创 HMM(隐马尔可夫模型)

参考自： http://blog.csdn.net/by21010/article/details/51506292目前的语音识别系统往往采用隐含马尔科夫模型（Hidden Markov Model，HMM）建模，表示某一语音特征矢量序列对某一状态序列的后验概率。隐含马尔科夫模型是一种概率图模型，可以用来表示序列之间的相关关系，常常被用来对时序数据建模。隐含马尔科夫模型是一种带权有向

2016-06-29 22:54:29 5666 2

原创 python 输出是省略号的问题

这个问题非常非常重要，搞了一晚上都没解决好，但是真的很简单很简单，如果你也是用的numpy array, 如果你也想得到输出矩阵的全部内容，而不是省略形式，[[ 0.10284943 0.0959931 0.00076021 ..., -0.01035775 0.02561938 0.09741836] [-0.01446581 -0.0427694

2016-06-24 10:56:49 28471 4

原创 MFCC 过程理解

－－－最近看信号处理相关的知识，会随时补充或者更正之前写的不对的地方，或者是补充一些自己的理解－－－－ref: https://www.zhihu.com/question/27268668 等。语音识别中常用的特征提取方法：声学特征有线性预测编码（Linear Predictive Coding，LPC），梅尔频率倒谱系数（Mel-frequency Cepstru

2016-06-16 14:39:01 18777

原创 kaldi跑timit的注意事项

今天用kaldi跑了一天调了一天，真是累屎鸟，遇到各种问题，每一个问题都自己找好久，还好有几位大神相助，非常感谢，下面总结一下：1、首先要改数据集的路径，这个是必须的2、irstlm 的错误问题，然后注意把extras下面的env.sh的关于irstlm的环境变量写到 tools 下面的env.sh, 因为path.sh是source的tools下面的环境env.sh3、关于单机跑t

2016-06-14 20:06:50 2288

转载 FCN（全卷积神经网络）

原文链接： http://mp.weixin.qq.com/s?__biz=MzI1NTE4NTUwOQ==&mid=2650324665&idx=1&sn=3022e7e75a4bad0acdde36fe3edf565e&scene=5&srcid=0603Le1GYOSbqw1m7oU5BdxF#rd从CNN 发展到 FCN ，从有监督训练到end to end, 通常CNN网络

2016-06-03 16:01:45 23095 2

原创云识别概念理解（私人理解）

云识别，之前不是很理解，最近跟做这个的交流了一下，对大体概念和流程有了一个整体的理解，记录一下，万一哪天要做呢深度学习做几类真对不同的图片识别的model, 最好是采用单进程＋多模型的方案，否则随着识别任务会越来越多，每个进程就得起一个端口号（不理解，为什么每一个进程都要占用一个端口号）通过用户的url请求，当然请求参数中带着图片的类别，然后根据本地训练好的模型，做预测。

2016-06-02 12:58:19 2006

mysql中文手册

很好的中文学习手册，平时没事多看看手册，mysql还是不难的

2013-06-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人