深度学习——全连接神经网络

yayakoko

已于 2023-11-14 10:42:36 修改

阅读量138

点赞数

文章标签：深度学习神经网络

于 2023-11-13 17:01:00 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yayakoko/article/details/134376795

版权

1、全连接网络结构

输入层 --> 隐藏层 --> 输出层

2、激活函数：

sigmoid：1/(1+e^-x)

优点：简单

缺点：反向传播造成梯度消失

输出的均值不为0，使梯度朝一个放向更新要么正，要么负

容易饱和，当梯度非常大趋近于1 ，当梯度非常小时趋于零，训练耗时

Tanh函数：（e^z - e^-z）/ e^z + e^-z

优点：解决了sigmoid输出值非0 对称

训练更快更容易收敛

缺点：反向传播容易造成梯度消失

ReLU函数：

y = x if x > 0

0 if x <= 0

优点：解决了梯度消失问题

计算更简单

缺点：可能出现神经元死亡

Leaky ReLU函数

y = x if x > 0

ax if x <= 0

优点：解决了ReLU的神经元死亡问题

缺点：正负输入的预测关系不一致

3、前向传播

a11= relu（x1*w11+x2*w12+b1）

a12 = relu（x1*w13+x2*w14+b2）

a21 = relu (a11*w21+a12*w22+b3)

y=a21

4、后向传播

1、首先根据链式求导获得离误差最近的参数 w21 w22 b2的梯度

2、再计算距离误差较远的参数 w11 w12 b1的梯度

3、根据链式法则求出所有参数的梯度，再对当前的参数进行更新。

eg：w11 =0.5 w21 =1 b1 = 1 b2 =1

dw11 = - 0.03 dw21 = -0.1 db1 = - 0.05 db2 = -0.3

w11 = 0.5-0.1*(-0.03)

w21 = 1 - 0.1*(-0.1)

b1 = 1-0.1*(- 0.05 )

b2 =11-0.1*( -0.3)

4、利用更新后的参数继续进行前向传播，得到新的输出值。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
深度学习——全连接神经网络

1、首先根据链式求导获得离误差最近的参数 w21 w22 b2。Tanh函数：（e^z - e^-z）/ e^z + e^-z。2、再计算距离误差较远的参数 w11 w12 b1。优点：解决了sigmoid输出值非0 对称。输入层 --> 隐藏层 --> 输出层。优点：解决了ReLU的神经元死亡问题。缺点：反向传播容易造成梯度消失。缺点：正负输入的预测关系不一致。缺点：反向传播造成梯度消失。优点：解决了梯度消失问题。缺点：可能出现神经元死亡。Leaky ReLU函数。
复制链接

扫一扫

博客等级

码龄6年

36
原创

29
点赞

31
收藏

57
粉丝

关注

私信

热门文章

分类专栏

PyTorch - Deep Learning
python 4篇

最新评论

pytorch ：LSTM二分类网络
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
股票交易最大利润
虎哥闯天涯: 博主多加油，继续编写，把股票交易得思路以及使用算法写出来，另外把代码注释加一下，以及测试用例

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。