自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (1)
  • 收藏
  • 关注

原创 神经网络中,梯度是如何计算的?

简单的花一点时间总结一下梯度的计算情况。要尽量少花一点的时间来总结基础知识,多去写写代码,调一下bug,再不调连debug都忘了。什么是梯度下降法?什么又是梯度?只看概念的话记不住,主要是理解。梯度:高数的知识,是个向量,每点只有一个梯度。=梯度的方向:与这个函数在该点增长最快的方向一致。梯度的大小:|梯度|=max(方向导数),具体概念都是高数的知识。上式要一阶可导。梯度下降法:求损失函...

2018-08-13 22:02:52 18735

原创 MFCC特征提取过程中,各步骤的概念详解

1.为什么用mfcc特征:在梅尔轴上,听觉是等距离的、等差的,但听觉轴上不是。听觉音高是梅尔,一个是响度,一个是音高,一起用时是最好的听觉特征,MFCC只用了响度。有一个假设是mfcc特征的均值(mean)和标准差(std)都是一样的。2.为何预加重:声门气流波,每倍频音下降12分贝。这是我们声带的特征。经过咽腔,口腔进行共振,最后通过嘴唇发出。在唇齿之间进行唇呛辐射时,每倍频音增加6...

2018-08-09 14:29:44 6437

原创 语音识别/声纹识别的基础概念

语言模型的作用:已知文本前面有若干个词,预测下一个词出现的概率是多少。简单地说,就是一句话符合不符合当前已知的说话习惯。N-gram模型:N-gram模型基于一个假设:第N个词的出现只与前面N-1个词相关,而与其它任何词都不相关,整句的概率就是各个词出现的概率的乘积。它没有训练的过程,只是统计当前词在N元组里出现的次数。一般业内最大的使用三元模型,也就是3-gram模型。因为虽然N越大...

2018-08-09 11:09:53 2537

原创 易于理解的一些时序相关的操作(LSTM)和注意力机制(Attention Model)

这是我看完很多博客和视频以后对LSTM和Attention Model的一个理解和总结,有一些公式的地方感觉在数学上不能严格的推导出来,就直接贴了流程图。自己能推导出来的,我用白话文字解释了公式的意思,尽量避免用一些难理解的词,有的地方举了些例子,如果不妥的话烦请指正。1. LSTM(长短时记忆网络)之前讲过了RNN循环神经网络,能解决神经网络中信息保存的问题。但是RNN还不够好,因为它存...

2018-08-02 00:32:51 64854 34

原创 Tensorflow函数/类,Tensorflow自定义损失函数,Tensorflow自定义复杂网络结构

Tensorflow基础知识回顾对于一个基础tensorflow程序来说,需要了解的东西有:(1)Placeholder,占位符,实际输入值,用它喂数据;(2)variable,参数变量,weights和biases要用的是它;(3)reshape,改变shape的值、维数的。(4)loss,损失函数,预测值与真实值的差别;(5)optimizer,优化器,已知有误差了,建...

2018-07-19 02:10:39 2936 3

数据结构C语言版习题

数据结构C语言版第一作者严蔚敏,全书所有章节重点知识点针对性习题。

2015-05-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除