人工神经网络—后向传播算法应用中的问题

最新推荐文章于 2022-10-17 17:52:20 发布

@DWC_DIP

最新推荐文章于 2022-10-17 17:52:20 发布

阅读量418

点赞数 1

分类专栏：机器学习系列文章标签：神经网络算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/DIPDWC/article/details/117029586

版权

后向传播算法应用中的问题

1. 回顾
2. 对非线性函数的改进
- 2.1 Sigmoid函数
- 2.2 tanh函数
3. 基于SoftMax函数和交叉熵的目标函数
4. 随机梯度下降法
5. 结尾
参考资料

1. 回顾

在上两讲中，我们讲解了如何利用后向传播算法训练多层神经网络，我们总结出了后向传播算法的基本框架，包含以下步骤：

（1）对神经网络每一层的各个神经元，随机选取相应的 $w, b$ 的值。

（2）前向计算，对于输入的训练数据，计算并保留每一层的输出值，直到计算出最后一层的输出 $y$ 为止。

（3）设置目标函数 $E$ ，例如 $:E=\frac12||y-Y||^2$ ，用后向传播算法对每一个 $w$ 和 $b$ ，计算 $\frac{∂E}{∂w}$ 和 $\frac{∂E}{∂b}$ 。

（4）利用如下迭代公式，更新 $w$ 和 $b$ 的值
$w^{(n+1)}=w^{(n)}-α{\frac{∂E}{∂w}|}_{w^{(n)},b^{(n)}}$

$b^{(n+1)}=b^{(n)}-α{\frac{∂E}{∂b}|}_{w^{(n)},b^{(n)}}$
其中 $α$ 是一个超参数，叫作学习率。

（5）回到（2）不断循环，直到所有 $|\frac{∂E}{∂w}|_{w^{(n)},b^{(n)}}$ ， $|\frac{∂E}{∂b}|_{w^{(n)},b^{(n)}}$ 很小为止，退出循环。

但是，在实际的应用中，我们却需要对上述基本框架进行一系列的改进，才能保证神经网络训练过程的顺利完成，这一讲将重点讲解三个重要的改进。学习完本讲后，大家可以利用多层神经网络解决实际分类的问题。

2. 对非线性函数的改进

第一个改进是对非线性函数的改进，我们前面提到，如果层与层之间的非线性函数是阶跃函数，即如下所示
$φ(x)=\begin{cases} 1, & x>0\\ 0, & x<0 \end{cases}$
在这里插入图片描述

图1 阶跃函数

如果非线性函数是阶跃函数，那么三层神经网络可以模拟任意的决策函数。我们回顾一下上一讲后向传播算法的递推公式

$δ_i^{(l)}=\frac {∂E}{∂z_i^{(l)}}=\frac {∂E}{∂y_i}\frac {∂y_i}{∂z_i^{(l)}}=(y_i-Y_i)φ'(z_i^{(l)})$

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
7
评论
人工神经网络—后向传播算法应用中的问题

后向传播算法应用中的问题1. 回顾2. 对非线性函数的改进2.1 Sigmoid函数2.2 tanh函数3. 基于SoftMax函数和交叉熵的目标函数4. 随机梯度下降法5. 结尾1. 回顾在上两讲中，我们讲解了如何利用后向传播算法训练多层神经网络，我们总结出了后向传播算法的基本框架，包含以下步骤：（1）对神经网络每一层的各个神经元，随机选取相应的 w,bw,bw,b 的值。（2）前向计算，对于输入的训练数据，计算并保留每一层的输出值，直到计算出最后一层的输出 yyy 为止。（3）设置目标函数EE
复制链接

扫一扫

专栏目录

评论 7

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。