![](https://img-blog.csdnimg.cn/20200321140226689.jpg?x-oss-process=image/resize,m_fixed,h_224,w_224)
语音识别(speech recognition)
文章平均质量分 89
语音识别(speech recognition)
代码款款
这个作者很懒,什么都没留下…
展开
-
TensorFlow RNN
来自硅谷工程师的Google TensorFlow 教程:开始训练你的第一个RNN吧http://www.cnetnews.com.cn/2017/1102/3099994.shtml(原文的github地址已经失效了,我的github地址是:同时源代码在运行时有点小错误,我也做了更正~)平安科技罗冬日:如何用RNN实现语音识别?| 分享总结https://www.leiphone.com/new...原创 2018-04-30 15:36:52 · 347 阅读 · 0 评论 -
深度学习开放数据集
来源:DeepLearning4J原文地址:https://deeplearning4j.org/cn/opendata本页为您整理汇总了各类可供机器学习研究使用的高质量数据集。欢迎您为本页列表推荐新的数据集!您还可以在维基百科等其他地方找到类似的数据集一览表。最近添加开源生物特征识别数据谷歌Audioset:包含取自YouTube视频的2,084,320条人工标记的10秒声音片段,数据集本体由6...转载 2018-05-02 10:44:28 · 5594 阅读 · 0 评论 -
kaldi io
原创 2018-04-29 14:25:54 · 373 阅读 · 0 评论 -
HMM(Hidden Markov Models)
在语音识别问题中,隐马尔科夫模型(HMM)是如何支持特征在时间轴上的扭曲的?https://www.zhihu.com/question/31154127/answer/50866837HMM(Hidden Markov Models)一个HMM有两部分:状态(state)/状态的转移(transition):描述了HMM的基本骨架,即一个HMM有多少个states,以及states之间的转移关系...转载 2018-04-30 00:54:45 · 791 阅读 · 0 评论 -
CTC loss 理解
前言:理解了很久的CTC,每次都是点到即止,所以一直没有很明确,现在重新整理。定义CTC (Connectionist Temporal Classification)是一种loss function传统方法 在传统的语音识别的模型中,我们对语音模型进行训练之前,往往都要将文本与语音进行严格的对齐操作。这样就有两点不太好: 1. 严格对齐要花费人力、时间。 2...原创 2018-05-16 11:37:24 · 43972 阅读 · 1 评论