深度学习
wy_19940822
这个作者很懒,什么都没留下…
展开
-
语音识别/声纹识别的基础概念
语言模型的作用:已知文本前面有若干个词,预测下一个词出现的概率是多少。简单地说,就是一句话符合不符合当前已知的说话习惯。N-gram模型:N-gram模型基于一个假设:第N个词的出现只与前面N-1个词相关,而与其它任何词都不相关,整句的概率就是各个词出现的概率的乘积。它没有训练的过程,只是统计当前词在N元组里出现的次数。一般业内最大的使用三元模型,也就是3-gram模型。因为虽然N越大...原创 2018-08-09 11:09:53 · 2542 阅读 · 0 评论 -
MFCC特征提取过程中,各步骤的概念详解
1.为什么用mfcc特征:在梅尔轴上,听觉是等距离的、等差的,但听觉轴上不是。听觉音高是梅尔,一个是响度,一个是音高,一起用时是最好的听觉特征,MFCC只用了响度。有一个假设是mfcc特征的均值(mean)和标准差(std)都是一样的。2.为何预加重:声门气流波,每倍频音下降12分贝。这是我们声带的特征。经过咽腔,口腔进行共振,最后通过嘴唇发出。在唇齿之间进行唇呛辐射时,每倍频音增加6...原创 2018-08-09 14:29:44 · 6445 阅读 · 0 评论 -
神经网络中,梯度是如何计算的?
简单的花一点时间总结一下梯度的计算情况。要尽量少花一点的时间来总结基础知识,多去写写代码,调一下bug,再不调连debug都忘了。什么是梯度下降法?什么又是梯度?只看概念的话记不住,主要是理解。梯度:高数的知识,是个向量,每点只有一个梯度。=梯度的方向:与这个函数在该点增长最快的方向一致。梯度的大小:|梯度|=max(方向导数),具体概念都是高数的知识。上式要一阶可导。梯度下降法:求损失函...原创 2018-08-13 22:02:52 · 18761 阅读 · 0 评论