语音
绝对不要看眼睛里的郁金香
博客分享记录自己学习轨迹与过程,很多转载,留下记忆,互相学习
展开
-
语音信号处理之(四)梅尔频率倒谱系数(MFCC)
语音信号处理之(四)梅尔频率倒谱系数(MFCC)zouxy09@qq.comhttp://blog.csdn.net/zouxy09 这学期有《语音信号处理》这门课,快考试了,所以也要了解了解相关的知识点。呵呵,平时没怎么听课,现在只能抱佛脚了。顺便也总结总结,好让自己的知识架构清晰点,也和大家分享下。下面总结的是第四个知识点:MFCC。因为花的时间不转载 2015-12-03 11:18:28 · 552 阅读 · 0 评论 -
语音识别基本原理介绍------dnn-hmm续
很久没更新博客了,最近找工作找的不是很顺利,我一直很看好语音的应用,觉得需求很多,但或许对应届生还是有些不一样,等确定了再分享下找工作的经验吧。这里主要说下语音识别现在大家都用的模型-----dnn-hmm,我自己也不能更好的去解释清楚,等我毕业前,我一定会把gmm-hmm和dnn-hmm的原理以最能理解的方式表达出来,我也很期待那一天。不多说了,直接说dnn-hmm。目前主流的方式是dnn-hm转载 2015-12-03 16:32:43 · 1464 阅读 · 0 评论 -
语音识别基本原理介绍--gmm-hmm中训练的完整版
看了几天了,结合之前看kaldi里的训练,现在我觉得可以稍微清楚的解释这个训练过程,后面的时间赶紧看解码部分。希望你可以有所收获。这次我们从头开始,虽然mfcc特征大家都知道,但是为了完整性还是说下吧。希望这是最后一次写训练的过程。1.数据准备我就不说了,直接说提特征,一般来说提mfcc特征。当然在gmm-hmm中一般都是mfcc特征。mfcc特征的具体流程,这里贴一张图,大家可以转载 2015-12-03 16:35:42 · 1539 阅读 · 0 评论 -
语音识别系统原理介绍---从gmm-hmm到dnn-hmm
一直想写个关于语音识别系统原理的博文。前段时间我和@零落一起做了很多实验,比如htk,kaldi等。从周五开始就已经放寒假了,明天就做火车回家了。今晚加点劲写点吧,回家由于没网。大家有问题只能留言或者找我qq,我尽量过段时间来回答吧。现在我就把语音识别的原理说下去。具体的框架图还是来一个把。这个图我也是我从网上找的。按照上图的说法,语音识别是由语言模型和声学模型构成的。下面转载 2015-12-03 16:13:24 · 875 阅读 · 0 评论 -
语音识别系统原理介绍----gmm-hmm
从寒假前的博客:语音识别系统原理介绍---从gmm-hmm到dnn-hmm,最近有时间的时候我还是在不断的去理解gmm-hmm这个基准模型。下面我讲从提玩mfcc特征开始说起,希望可以让你有所收获吧。 提完mfcc特征,就相当于剩下一个13维*帧数的矩阵。接下来,就是用混合高斯模型了。怎么用?就用多维的高斯模型区模拟我们得到的矩阵,相当于拟合。相当于我们假设其服从高斯分布,然后我们转载 2015-12-03 16:34:08 · 660 阅读 · 0 评论 -
DNN与微软同声传译系统背后的故事
摘要:2012年10月的天津,微软在“21世纪的计算大会”上展示了一套全自动同声传译系统。流畅的效果令其背后的关键技术DNN(深层神经网络)第一次进入了许多人的视野。本文将讲述DNN与这套同声传译系统背后的故事。2012年10月的天津,微软首席研究官Rick Rashid在“21世纪的计算大会”上公开演示了一个全自动同声传译系统,他的英文演讲被实时转换成与他的音色相近、字正腔圆的中文。流畅转载 2015-12-03 16:00:57 · 866 阅读 · 0 评论 -
GMM-HMM语音识别模型 原理篇
本文简明讲述GMM-HMM在语音识别上的原理,建模和测试过程。这篇blog只回答三个问题:1. 什么是Hidden Markov Model?HMM要解决的三个问题:1) Likelihood2) Decoding3) Training2. GMM是神马?怎样用GMM求某一音素(phoneme)的概率?3. GMM+HMM大法解决语音转载 2015-12-03 16:34:51 · 394 阅读 · 0 评论 -
语音识别基本原理介绍之gmm-hmm续
在之前的博文里,我已经写过了一篇博文:语音识别系统原理介绍----gmm-hmm,但是觉得还是没有说清楚这个事情,特别是在gmm和hmm过程里。过段时间也要找工作了,很有必要再弄清楚。现在这里说下,但愿可以说的很清楚,如果有错误,欢迎指正。 因为截图跟公式的原因,我就用图片的形式呈现,如需要word版或者pdf版,请留言。转载 2015-12-03 16:33:18 · 347 阅读 · 0 评论 -
Just Say It!——DNN在语音识别系统中的应用
作者:james 1. 背景介绍 近些年来,随着Siri的走红,类似Siri、搜狗语音助手这样利用语音实现控制,语义理解的系统开始大量涌现。而语音识别系统作为这类系统的入口,很大程度上决定了这类应用的质量。没有一个好的语音识别系统做支撑,再好的助手也只能干瞪眼。 与此同时,随着微信的发展,越来越多的用户反馈,在多种场合下转载 2015-12-03 16:25:39 · 631 阅读 · 0 评论