机器学习系列26-循环神经网络(Ⅰ)

Sakura_gh

于 2020-07-30 16:29:32 发布

阅读量2.6k

点赞数 8

分类专栏：机器学习文章标签：神经网络 python 人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44406200/article/details/107693331

版权

Recurrent Neural Network(Ⅰ)

RNN，或者说最常用的LSTM，一般用于记住之前的状态，以供后续神经网络的判断，它由input gate、forget gate、output gate和cell memory组成，每个LSTM本质上就是一个neuron，特殊之处在于有4个输入： $z$ 和三门控制信号 $z_i$ 、 $z_f$ 和 $z_o$ ，每个时间点的输入都是由当前输入值+上一个时间点的输出值+上一个时间点cell值来组成

Introduction

Slot Filling

在智能客服、智能订票系统中，往往会需要slot filling技术，它会分析用户说出的语句，将时间、地址等有效的关键词填到对应的槽上，并过滤掉无效的词语

词汇要转化成vector，可以使用1-of-N编码，word hashing或者是word vector等方式，此外我们可以尝试使用Feedforward Neural Network来分析词汇，判断出它是属于时间或是目的地的概率

但这样做会有一个问题，该神经网络会先处理“arrive”和“leave”这两个词汇，然后再处理“Taipei”，这时对NN来说，输入是相同的，它没有办法区分出“Taipei”是出发地还是目的地

这个时候我们就希望神经网络是有记忆的，如果NN在看到“Taipei”的时候，还能记住之前已经看过的“arrive”或是“leave”，就可以根据上下文得到正确的答案

这种有记忆力的神经网络，就叫做Recurrent Neural Network(RNN)

在RNN中，hidden layer每次产生的output $a_1$ 、 $a_2$ ，都会被存到memory里，下一次有input的时候，这些neuron就不仅会考虑新输入的 $x_1$ 、 $x_2$ ，还会考虑存放在memory中的 $a_1$ 、 $a_2$

注：在input之前，要先给内存里的 $a_i$ 赋初始值，比如0

注意到，每次NN的输出都要考虑memory中存储的临时值，而不同的输入产生的临时值也尽不相同，因此改变输入序列的顺序会导致最终输出结果的改变(Changing the sequence order will change the output)

Slot Filling with RNN

用RNN处理Slot Filling的流程举例如下：

“arrive”的vector作为 $x^1$ 输入RNN，通过hidden layer生成 $a^1$ ，再根据 $a^1$ 生成 $y^1$ ，表示“arrive”属于每个slot的概率，其中 $a^1$ 会被存储到memory中
“Taipei”的vector作为 $x^2$ 输入RNN，此时hidden layer同时考虑 $x^2$ 和存放在memory中的 $a^1$ ，生成 $a^2$ ，再根据 $a^2$ 生成 $y^2$ ，表示“Taipei”属于某个slot的概率，此时再把 $a^2$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。