- 博客(7)
- 资源 (1)
- 收藏
- 关注
转载 语音识别中的声学模型(AM)和语言模型(LM)
本文主要受参考自: http://blog.csdn.net/by21010/article/details/51506292 以及: https://www.zhihu.com/question/35833334最近看essen源码,感觉对于ASR 的一下之前的比较基础的算法很生疏, 在知乎上看到这个链接,感觉讲的比较通俗易懂,拿来再理解一下。decoder是根据声学模型和语音模型,将
2016-06-29 23:12:01 43043 1
原创 HMM(隐马尔可夫模型)
参考自: http://blog.csdn.net/by21010/article/details/51506292目前的语音识别系统往往采用隐含马尔科夫模型(Hidden Markov Model,HMM)建模,表示某一语音特征矢量序列对某一状态序列的后验概率。隐含马尔科夫模型是一种概率图模型,可以用来表示序列之间的相关关系,常常被用来对时序数据建模。 隐含马尔科夫模型是一种带权有向
2016-06-29 22:54:29 5666 2
原创 python 输出是省略号的问题
这个问题非常非常重要,搞了一晚上都没解决好,但是真的很简单很简单, 如果你也 是用的numpy array, 如果你也想得到输出矩阵的全部内容,而不是省略形式,[[ 0.10284943 0.0959931 0.00076021 ..., -0.01035775 0.02561938 0.09741836] [-0.01446581 -0.0427694
2016-06-24 10:56:49 28471 4
原创 MFCC 过程理解
---最近看信号处理相关的知识,会随时补充或者更正之前写的不对的地方,或者是补充一些自己的理解----ref: https://www.zhihu.com/question/27268668 等。 语音识别中常用的特征提取方法: 声学特征有线性预测编码(Linear Predictive Coding,LPC),梅尔频率倒谱系数(Mel-frequency Cepstru
2016-06-16 14:39:01 18777
原创 kaldi跑timit的注意事项
今天用kaldi跑了一天调了一天,真是累屎鸟,遇到各种问题,每一个问题都自己找好久,还好有几位大神相助,非常感谢, 下面总结一下:1、首先要改数据集的路径,这个是必须的2、irstlm 的错误问题,然后注意把extras下面的env.sh的关于irstlm的环境变量写到 tools 下面的env.sh, 因为path.sh是source的tools下面的环境env.sh3、关于单机跑t
2016-06-14 20:06:50 2288
转载 FCN(全卷积神经网络)
原文链接: http://mp.weixin.qq.com/s?__biz=MzI1NTE4NTUwOQ==&mid=2650324665&idx=1&sn=3022e7e75a4bad0acdde36fe3edf565e&scene=5&srcid=0603Le1GYOSbqw1m7oU5BdxF#rd从CNN 发展到 FCN ,从有监督训练到end to end, 通常CNN网络
2016-06-03 16:01:45 23095 2
原创 云识别概念理解(私人理解)
云识别,之前不是很理解,最近跟做这个的交流了一下,对大体概念和流程有了一个整体的理解,记录一下,万一哪天要做呢深度学习做几类真对不同的图片识别的model, 最好是采用 单进程 + 多模型 的方案, 否则随着识别任务会越来越多,每个进程就得起一个端口号(不理解,为什么每一个进程都要占用一个端口号)通过用户的url请求,当然请求参数中带着图片的类别,然后根据本地训练好的模型,做预测。
2016-06-02 12:58:19 2006
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人