【趣谈】BP神经网络是如何演变出RNN神经网络的

老饼讲解-BP神经网络

于 2024-06-24 06:16:19 发布

阅读量1.1k

点赞数 45

分类专栏：模型介绍文章标签：神经网络 rnn 人工智能

本文链接：https://blog.csdn.net/dbat2015/article/details/139899987

版权

模型介绍专栏收录该内容

13 篇文章 4 订阅

订阅专栏

本文来自《老饼讲解-BP神经网络》https://www.bbbdata.com/

一、BP神经网络是什么

一般最常用的是三层的BP神经网络，它只要隐节点足够多就足以拟合任意曲线。
三层BP神经网络的结构
如果从它的数学表达式来看，就更容易理解它的意义了：
BP神经网络的表达式
是的，BP神经网络简单来说就只是用多个tansig函数来拟合目标函数。
如果要简洁地总结BP神经网络是什么，那就是"一个可以拟合任意函数的模型"

二、BP神经网络如何解决序列预测问题

序列数据的后一个数据与前面的数据相关，这是序列数据的特性。例如房价就是序列数据，每月的房价不仅受当前市场各种因素的影响，它还与上个月的房价紧密相关。

2.1. BP解决序列预测-Jordan神经网络

要用bp神经网络预测序列数据，最简易的思路就是把前一个数据的输出加入到当前数据中作为输入变量，因为当前的输出不仅受x的影响，还受之前的y的影响：

没错，就是这么简单，就诞生了最初代的循环神经网络-Jordan神经网络。

2.2.RNN神经网络

而Elman则提出，不要把上一时刻的y加到隐层，而是把上一时刻的隐层加到当前隐层

为啥要用上一时刻的隐层来替代y呢？因为y就是隐层计算得到的，可见隐层是"更原始"的变量，这样对信息的使用更为充分。没错，Elman的这一改动可以说是个壮举，太实用了，所以都不叫Elman神经网络了，直接称为“RNN神经网络”或“基础RNN神经网络”。
RNN一般按时序展开，就如下图所示：

它实际就是一个三层的BP神经网络，然后每层除了实时输入X，还接受来自上一层的隐层作为延迟输入。RNN就是如此简单，实际就是“用于解决序列预测的BP神经网络”。
BP神经网络是一个非常有趣的东西，不仅它自身在曲线拟合上取得的极佳效果，它还生了几个儿子：CNN，RNN，编码器，个个儿子都这么出色。