【李宏毅机器学习】Recurrent Neural Network Part1 循环神经网络（p20）学习笔记

最新推荐文章于 2021-07-19 21:04:20 发布

duanyuchen

最新推荐文章于 2021-07-19 21:04:20 发布

阅读量552

点赞数 1

分类专栏： Machine Learning 文章标签：机器学习李宏毅学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41894030/article/details/107577137

版权

Machine Learning 专栏收录该内容

20 篇文章 3 订阅

订阅专栏

李宏毅机器学习学习笔记汇总
 课程链接

文章目录

Example Application
Recurrent Neural Network（RNN）
RNN 的变形

Example Application

Slot Filling

在这里插入图片描述
可以使用前馈神经网络来实现，需要把每个词用向量来表示。

把词用向量来表示的方法

1-of-N encoding / one-hot

在这里插入图片描述

Beyond 1-of-N encoding

多一个纬度other，不在词典中的词汇归类入other
在这里插入图片描述

存在的问题

词汇表示为一个向量，输入是这个向量，输出是一个概率分布，属于某种的概率
在这里插入图片描述
神经网络在输入同一个词输出的概率分布是一样的，但是这样是不对的（如下图例子），所以我们希望神经网络是有记忆的。

Recurrent Neural Network（RNN）

有记忆的神经网络，叫做RNN。

每次hidden layer里的neural产生输出的时候都会存到内存中，在下一次有input的时候，hidden layer的neural不止会考虑input还会考虑内存中的值。
在这里插入图片描述

Example

假设weight都是1，没有bias，激活函数都是线性的。
输入和输出都是一个序列。

第一次：内存中还没存过东西，都是0，输入为1，计算后存入内存

在这里插入图片描述
第二次：考虑输入和内存，得到新的结果并且保存
（哪怕两次输入是一样的，输出结果是不一样的，因为内存中的值是不一样的）

第三次：重复上述步骤。。。

在RNN中，改变输入序列的顺序，将会改变输出。

RNN 处理slots filling问题

RNN处理的流程：

ps：并不是有三个神经网络，而是同一个神经网络在三个不同的时间点，被使用了三次
在这里插入图片描述

Of course it can be deep…

在这里插入图片描述

RNN 的变形

Elman Network 和 Jordan Network

Elman Network：把hidden layer的值存起来，在下一个时间点读出来，如前面的例子

Jordan Network：存的是整个网络的output的值，在下一个时间点再读出来。
在这里插入图片描述

Bidirectional RNN

RNN还可以是双向的。可以看到更多的东西，得到更好的performance。
在这里插入图片描述

Long Short-term Memory(LSTM)

neutral的output想要写入内存前需要经过一系列的闸门。
input gate：打开的时候neutral的output才可以被写入内存
output gate：外界其他的neutral是否可以通过内存读出值。
forget gate（遗忘门）：什么时候内存要把过去的东西忘掉

以上三个都是需要网络自己学习。

LSTM可以看作有四个input，一个output

input ：

想要被存到内存的值
操控input gate的信号
操控output gate的信号
操控forget gate的信号

在这里插入图片描述

LSTM - Example

在这里插入图片描述

图上标记出来的权重假设是已经训练好的参数

在这里插入图片描述
完整流程：（假想已知参数，不用梯度下降了）
输入310

输入410
在这里插入图片描述
输入200

输入101
在这里插入图片描述
输入3 -1 0

传统神经网络和LSTM的区别

四倍参数。

LSTM

在这里插入图片描述

还没结束，进一步的：
加上前一个时间点的output h
在这里插入图片描述
把存在内存中的值也加进去

Multiple-layer LSTM

在这里插入图片描述
哭了

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。