Neural Network with Memory

最新推荐文章于 2024-07-13 11:10:11 发布

我是个粉刷匠

最新推荐文章于 2024-07-13 11:10:11 发布

阅读量520

点赞数

分类专栏：李宏毅-ML(DS)-15秋

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_18124075/article/details/81190330

版权

李宏毅-ML(DS)-15秋专栏收录该内容

8 篇文章 0 订阅

订阅专栏

目录

Vanilla Recurrent Neural Network (RNN)

Variants of RNN

Long Short-term Memory (LSTM)

链接：http://speech.ee.ntu.edu.tw/~tlkagk/courses/MLDS_2015_2/Lecture/RNN%20(v4).pdf

Vanilla Recurrent Neural Network (RNN)

RNN

在了解RNN之前，也许会有人想我都学会了之前的DNN为啥还需要再学习这玩意儿呢？我们就拿语音识别来说吧，我们把每一帧的当作DNN的输入，输出为每一帧对应的因素，但是此时帧与帧之间是相互独立，对于语音帧来说，每一帧之间是相互关联的，因此会漏掉很多信息。

考虑到上下文信息，我们使用RNN，此时每个RNN中的所有网络都是一样的；当决定y2的值时，不止要考虑x2的值，还考虑a1的值，而a1又是由x1决定的。即yi是由x1,x2,…,xi共同决定，这是DNN无法做到的。

但是RNN却难以做到的是:如果让x2不要影响y3的值，x1影响y3的值，RNN却很难做到。

Cost

RNN的cost function和DNN的是大同小异。但是RNN会出现一种情况，随着epoch的增加，cost逐渐下降，但是到了某一个epoch会突然增加。这种情况与bug无关，至今尚未得到解决。

Application

应用：句子中名词的抓取，比如让机器知道Harry是一个人，Howgwarts是一个机构，Privet是一个地方。信息提取，比如让机器能够自动地学出Boston是出发地，November 2nd是出时间，Taipei是目的地，2 p.m是到达时间。

Variants of RNN

Input和Output是一样的数目，在Jordan Network当中，output输出为1w维的时候，网络很容易被训坏，不过Jordan Network的效果要比Elman Network要好一些。整个网络都是由左向右训的。

Input和Output是一样的数目，整个网络都是由左向右训的。

整个网络都是由左向右和由右向左训的两部分组成。

Input的数目是多个，Output的数目是一个，我们好需要把当前的内容转化为vector。

Input的数目是多个，Output的数目是多个且比较短。对于有叠字的情况，语音识别效果会特别差，所以可以使用Connectionist Temporal Classification (CTC)。

一般用于机器翻译的场合，Input和Output的数目都是很多的，而且长度也完全不一样。一般输入可以通过“==”去判断是否终止。

Input的数目是一个，为一张图片，而Output的数目是多个，为很多的文字。

Long Short-term Memory (LSTM)

下面是一些关于循环神经网络的笔记：

我是个粉刷匠

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。