手撕神经网络-正/反向传播

四维空间151

已于 2023-05-24 10:50:58 修改

阅读量152

点赞数 1

分类专栏：深度学习文章标签：神经网络人工智能深度学习

于 2023-04-02 22:06:01 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xingxingzhilong/article/details/129918170

版权

深度学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

摘要：最近的ChatGpt非常火热，强大的智能能力让人不禁感叹，人类是不是要被AI取代了，有人惶恐、有人兴奋。每一次新技术的爆发，必然会带动一部分就业，我们要抱着积极的态度去了解他。

今天，我们分享一下，什么是正向传播，什么是反向传播，有哪些理论依据。随着机器学习这门专业的发展，传统的机器学习已经不能够满足AI行业的发展了，随之诞生出来的神经网络、深度神经网络这些课程。

将学习过程想象成自然界中神经信息传递的过程，拟态到神经网络中，让计算机“拥有”了自然界中的“神经元”。粗略地说，接收信息被大脑捕获，这个过程可以看作是一个正向的过程。大脑下达的指令可以看作是一个反向的过程。那计算机是如何处理和优化这个过程的呢。

先看图1.1

图1.1

图1.1 简单模拟了神经信息的传递，假设每个圈代表着神经的接触端（可以发出信号、也可以接收信号），每个带箭头的线段代表着信息传递的方向（表示可以传递给下一个或者多个接触端）。当然这些都是以生物学的角度来衡量的，但是以计算机的角度来说，这其实就是一个图的计算，唯一要注意的是，这个图计算的不是节点的数据，而是节点和权重的数据。

我们先做一个假设以此来计算，假设有如下数据：

x1=1，x2=1，Y=5，w11=1，w12=1，w21=1，w22=1，b=1

说明下：x1、x2 作为输入参数也就是样本，Y作为样本对应的真实值，w11、w12、w21、w22作为权重，b作为偏移常数，圆圈代表输入或者输出节点：x系列代表输入层、z系列代表隐藏层、a系列代表隐藏层（激活），y代表样本预测。

通过说明我们知道，唯一可以确定的数据就是样本数据：x1，x2，Y，那么我们需要做的就是要能够获取到合适的w11、w12、w21、w22的值，使得y更加接近Y。

那么，我们看下第一次的预测结果是什么，通过数据带入得到以下数据：

z1=x1*w11+x1*w12+b=1*1+1*1+1=3

z2=x2*w21+x2*w22+b=1*1+1*1+1=3

这里我们介绍下激活函数使用Relu函数，如图1.2

图1.2

a1=3,a2=3

整理下：

z1=x1*w11+x1*w12+b=1*1+1*1+1=3

a1=3

z2=x2*w21+x2*w22+b=1*1+1*1+1=3

a2=3

y=a1+a2+b=3+3+1=7

这个过程就是一个正向传播的过程。

我们看下误差偏移了多少，这里我们定义一个损失函数J（lossfunction）

J==2

我们发现预测值y与真实Y存在一定的差异，说明w11、w12、w21、w22的数据不合适，需要调整，调整的过程我们就称之为反向过程。那么就以w11为例，w11=w11-l*w11_gradient。

w11：w11的值。

l：表示学习率，作为超参可以自己定义，这里定义为0.02。

w11_gradient：这个表示求w11的梯度。

通过上述的公式，我们发现，只要获取到w11_gradient，那么w11的数据就会被更新了。也就说我们需要对误差进行梯度。

w11_gradient=dJ/dw11=(dJ/dy) * (dy/da1)*(da1/dz1)*(dz1/dw11)

将数据进行带入dJ/dw11=（y-Y）*1*1*1=(7-5)*1=2

所以w11_gradient=2，w11=1-0.02*2=0.96，最后，w11更新为了0.96。

至此，上述过程为反向传的过程，重复这个过程，直到达到满意的一个预测结果，就可以结束这个过程了。

上述的过程我们发现了初始化的数据对训练会产生影响，所以你发现在哪里产生影响了吗？

今天就到这里了，下次再聊。

如有疑问请添加群：195889612

四维空间151

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

四维空间151 CSDN认证博客专家 CSDN认证企业博客

码龄16年

20: 原创

27万+: 周排名

8万+: 总排名

25万+: 访问

: 等级

353: 积分

16: 粉丝

20: 获赞

10: 评论

65: 收藏

私信

关注

热门文章

分类专栏

最新评论

深度学习-VGG19网络识别手写汉字（基于HWDB1.1trn_gnt）
m0_63230650: 博主你好，可以分享一下第六步预测自己的图片的代码吗
记录指定GPU并行训练失效问题
CSDN-Ada助手: 恭喜作者发布了第19篇博客！记录指定GPU并行训练失效问题，这个主题非常实用和有趣。希望作者可以继续分享更多关于GPU并行训练方面的经验和解决方案，为读者提供更多有用的信息。同时，建议作者可以尝试探讨一些新颖的GPU并行训练技术或者深入研究一些相关领域，让读者更加深入地了解这个话题。希望作者能够不断学习和进步，继续创作更加优质的内容！
深度学习-VGG19网络识别手写汉字（基于HWDB1.1trn_gnt）
四维空间151: 文章里面有的，你看下
深度学习-VGG19网络识别手写汉字（基于HWDB1.1trn_gnt）
a2428381304: 博主好，我用代码解析出来的手写汉字图集只有数字编号没有前面的汉字，请问能分享一下解析出来的的汉字图集吗
使用深度神经网络对医学影像进行疾病预测.Part1
CSDN-Ada助手: 恭喜您发布了第17篇博客，标题看起来非常有吸引力！您对使用深度神经网络对医学影像进行疾病预测的研究似乎非常深入，我对您的工作表示钦佩。希望您能在接下来的博客中，更深入地探讨深度神经网络在医学影像领域的应用，以及对疾病预测的准确性和可靠性进行更多的讨论。期待您的下一篇博客！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。