神经网络-课程作业记录

最新推荐文章于 2023-09-25 08:21:03 发布

东方翼轩

最新推荐文章于 2023-09-25 08:21:03 发布

阅读量268

点赞数

分类专栏：机器学习文章标签：神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/h506365608/article/details/48184751

版权

机器学习专栏收录该内容

1 篇文章 0 订阅

订阅专栏

以下是手绘的一个三层神经网络传播的一个流程图

forward propagation的计算没有问题：

然后得到Neural Networks的Cost Function:
这里写图片描述

然后是BP算法用来计算J(θ)对每一个θ的偏导数
以下是Backpropagation Algorithm：

计算方法：
对于给定 $θ_{ij}^{(l)}$ ，考虑 $Z^{(l+1)}$ ，它只参与了 $Z_i^{(l+1)}$ 的计算，于是问题转换到了 $\frac {\partial J(Z^{(l+1)})}{\partial Z_i^{(l+1)}}$ ，而对于 $\frac {\partial J}{\partial Z_i^{(l+1)}}$ 的计算又要通过对 $\frac {\partial J}{\partial Z_i^{(l+2)}}$ 的计算。
定义“残差” $\delta_i^{(l)}$ 为 $\frac {\partial J}{\partial Z_i^{(l)}}$ （直观上就是对 $\frac{\partial J}{\partial θ_{ij}^{(l-1)}}$ 的大小，越大表示没有到最优化）。
在视频和作业中，定义 $\delta_i^{(n_l)}$ ( $n_l$ 为网络的层数) ：直接是 $\delta_i^{(n_l)} = (a_i^{(n_l)} - y_i)$ 。然后经计算， $\delta_i^{(l)} = (\varTheta^{(l)})^T\delta_i^{(l+1)} .*g'(z_i^{(l)})$

即：
这里写图片描述
W就是 $\varTheta$ 矩阵， b为bias项(就是乘1项)相应的 $\varTheta$
梯度下降过程：
反复迭代：

注意对于 $\varTheta$ 矩阵随机初始化过程：
这里写图片描述

最后我们来看看我们作业中，这个三层神经网络的隐藏层做了什么（虽然不明白它表示了什么）：
这里写图片描述

Reference:
张睿卿（Rachel Zhang）的博客：
http://blog.csdn.net/abcjennifer/article/details/7758797
Pro. Ng的UFLDL教程及相关中文翻译：
http://t.cn/zYn4Ugl

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
神经网络-课程作业记录

以下是手绘的一个三层神经网络传播的一个流程图 forward propagation的计算没有问题：然后得到Neural Networks的Cost Function: 然后是BP算法用来计算J(θ)对每一个θ的偏导数以下是Backpropagation Algorithm：计算方法：对于给定θ(l)ijθ_{ij}^{(l)}，考虑Z(l+1)Z^{(l+1)}，
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。