什么是RNN?

01

顺序的重要性

       在前面学习CNN神经网络的时候,我们可以发现,我们输入的每张图片都是孤立的。例如,输入与1张图片,网络认出这张图片里面的内容是苹果,并不会对认出下一张图片是西红柿造成影响。但是对于语言来说,顺序十分重要。例如:“吃饭没、没吃饭、没饭吃、饭没吃、饭吃没”,这些都是不同的含义。所以,顺序的改变,表达完全不同的意义。

 

     当然,顺序也表达了一定的信息,例如“吃”后面,大概率接的是食物名词。当然这里可能有小伙伴“刚”我,说“吃人”、“吃土”呢?我相信大多数人没这么血腥,我们都是善良的“宝宝”,对吧!当然“吃土”,也不至于这么惨!,这里讲的是一个大概率嘛。


02

RNN的概念

     为了找到这种顺序的关联,RNN就冒头了。RNN,Recurrent Neural Network中文叫做循环神经网络RNN是一个高度重视序列信息的网络。

 

       序列就是数据的前后关系。RNN的基础结构仍然是神经网络,只不过,它比其他神经网络多了一个小盒子,这个小盒子用来记录数据输入时网络的状态。在下以此网络输入的时候,网络必须要考虑小盒子中保存的信息,随着数据的一次次的输入,盒子中的信息也在不断的更新,盒子中的信息被称为隐状态。


03

RNN的应用

       和开始举出的例子一样,RNN最常见的应用领域是自然语言处理,机器翻译是寻找相同的意义序列,在不同的语言中进行表达。诗歌生成是基于主题,按照一定的规则生成有逻辑的词语序列,改变两端的信息类型。输入图片,输出句子,就是看图说话。

 

      语音同样可以看作声音信号根据时间顺序组成的序列。语音识别和语音生成,同样在RNN的能力范围内。股票价格也可以看着一个受时间影响的序列。很多量化交易模型的建立,就是基于这样的认知。


 

04

RNN的优缺点

      不过RNN有不是完美无瑕的,它也有缺点。数据输入的越早,在隐状态中占据的影响也就越小,也就是说,如果一个句子很长,RNN就容易忘记最开始说了啥。

       面对这种问题,人们提出了RNN的改良版--LSTM,长短时记忆模型。这个模型下节课再和小伙伴们分享!!!

好了,本节课到此位置,想一起学习与了解AI和编程的请通过以下方式与小编沟通:

微信公众号:AI future

微  信  号:17378203668

抖  音  号:846689074

CSDN:小ai同学1号

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值