神经网络

最新推荐文章于 2023-05-28 08:06:45 发布

qq_16608563

最新推荐文章于 2023-05-28 08:06:45 发布

阅读量379

点赞数

分类专栏：深度学习

本文链接：https://blog.csdn.net/qq_16608563/article/details/86154029

版权

本文介绍了神经网络的基础知识，包括神经元模型、多层前馈神经网络以及误差逆传播算法（BP神经网络）。讨论了神经元的激活函数，特别是Sigmoid函数，以及神经网络的学习过程，即通过调整连接权和阀值来拟合训练数据。重点讲述了BP算法的原理，包括误差的计算、参数更新规则，并分析了全局最小与局部最小的概念，提出了防止过拟合的策略，如早停和正则化。

摘要由CSDN通过智能技术生成

神经元模型

神经网络是由具有适应性的简单单元组成的广泛并行互连的网络，它的组织能够模拟生物神经系统对真实世界物体所作出的交互反应。

神经网络中最基本的成分是神经元模型，即上述定义中的“简单单元”。
M-P神经元模型：在这个模型中，神经元接收到来自n个其他神经元传递过来的输入信号，这些输入信号通过带权重的连接进行传递，神经元接收到的总输入值将与神经元的阀值进行比较，然后通过“激活函数”处理以产生神经元的输出。
在这里插入图片描述
理想的激活函数是下图（a）中所示的阶跃函数：将输入值映射为输出值“0”或“1”
“1”对应于神经元兴奋，“0”对应神经元抑制。然而阶跃函数具有不连续、不光滑等不太好的性质。
实际常用Sigmoid函数作为激活函数。
在这里插入图片描述
把许多的这样的神经元按一定的层次结构连接起来，就得到了神经网络。

从计算机科学的角度看，只需将一个神经网络视为包含了许多参数的数学模型，这个模型是若干个函数，例如 $y_i=\displaystyle\sum_{i=1}^{n}(ω_ix_i-θ_j)$ 相互（嵌套）代入而得。

多层前馈神经网络

每层神经元与下一层神经元全互连，神经元之间不存在同层连接，也不存在跨层连接。这样的神经网络称作“多层前馈神经网络”
前馈并不意味着网络中的信号不能向后传，而是指网络拓扑结构上不存在环或回路。
在这里插入图片描述
神经网络的学习过程，就是根据训练数据来调整神经元之间的“连接权”以及每个功能神经元的阀值；
换言之，神经网络“学”到的东西，蕴含在连接权与阀值中。

误差逆传播算法（bp神经网络）

对于给定的训练集 $D=\{(x_1,y_1),(x_2,y_2)……(x_m,y_m)\},x_i∈R^d,y_i∈R^l$ ,即输入实例由d个属性描述，输出 $l$ 维实值向量。
在这里插入图片描述
拥有d个输入神经元、 $l$ 个输出神经元、 $q$ 个隐层神经元的多层前馈网络结构，
1）其中输出层第 $j$ 个神经元的阀值用 $θ_j$ 表示，
2）隐层第 $h$ 个神经元的阀值用 $γ_h$ 表示
3）输入层第 $i$ 个神经元与隐层第 $h$ 个神经元之间的连接权为 $v_{ih}$
4）隐层第 $h$ 个神经元与输出层第 $j$ 个神经元之间的连接权为 $ω_{hj}$
5）隐层第 $h$ 个神经元接收到的输入为 $α_h=\displaystyle\sum_{i=1}^{d}v_{ih}x_i$
6）输出层第 $j$ 个神经元接收到的输入为 $β_j=\displaystyle\sum_{h=1}^{q}ω_{hj}b_h$
其中 $b_h$ 是隐层第 $h$ 个神经元的输出。

对训练实例 $x_k,y_k)$ ，假定神经网络的输出为 $\hat{y}_k=(\hat{y}_1^k,\hat{y}_2^k……\hat{y}_l^k)$
即： $\hat{y}_j^k=f(β_j-θ_j)$ (式1.1)
神经网络在 $x_k,y_k)$ 上的均方误差为： $E_k=\frac{1}{2}\displaystyle\sum_{j=1}^{l}(\hat{y}_j^k-y_j^k)^2$