chapter-4-介绍神经网络

最新推荐文章于 2023-05-14 16:16:20 发布

JachinMa

最新推荐文章于 2023-05-14 16:16:20 发布

阅读量393

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/JachinMa/article/details/90216706

版权

反向传播

首先介绍一个概念：计算图。简单来说，计算图是一个函数的可视化表达，如下图：
在这里插入图片描述
其中每个节点代表一个计算。

利用计算图，我们可以很容易地使用反向传播的思想计算每个变量的梯度：
在这里插入图片描述
首先我们在每个运算后定义一个变量来保存其对应的运算结果，如上图的q和f；然后我们从后向前地分别计算每个运算结果对其上一级变量的导数，如df/dq、df/dz、dq/dx；依次这样做，直到到达了计算图的最前面，即输入数据处。此时计算结果对应输入数据的导数，即df/dx时，利用链式求导法则，只需一路将从f到x的路径上的导数相乘即可。

一个稍复杂的例子如下图：
在这里插入图片描述
值得注意的一点是，这里可以聚合几个运算，把它们视作一个运算进行处理。这是因为sigmoid函数的有着非常优美的求导结果。这种处理方式可以简化神经网络，或许也能减少算法的运算时间。

这里举出了一个包含矩阵的计算图计算的例子：

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
chapter-4-介绍神经网络

反向传播首先介绍一个概念：计算图。简单来说，计算图是一个函数的可视化表达，如下图：其中每个节点代表一个计算。利用计算图，我们可以很容易地使用反向传播的思想计算每个变量的梯度：首先我们在每个运算后定义一个变量来保存其对应的运算结果，如上图的q和f；然后我们从后向前地分别计算每个运算结果对其上一级变量的导数，如df/dq、df/dz、dq/dx；依次这样做，直到到达了计算图的最前面，即输入...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。