Coursera deeplearning.ai 深度学习笔记1-4-Deep Neural Networks-深度神经网络原理推导与代码实现

最新推荐文章于 2022-08-03 00:05:51 发布

tu天马行空

最新推荐文章于 2022-08-03 00:05:51 发布

阅读量1.5k

点赞数 1

分类专栏： Coursera 深度学习文章标签： coursera deeplearning 神经网络深度学习

本文链接：https://blog.csdn.net/tuzhen301/article/details/78779918

版权

这篇博客详细介绍了Coursera上的深度学习课程，内容涵盖深度神经网络的原理推导，包括网络表示、正向传播、反向传播、梯度下降以及超参数。此外，还讨论了代码实现，包括初始化、正向传播的线性与线性激活部分、计算代价函数、反向传播的线性与线性激活部分、参数更新、模型构建、样本预测和测试。

摘要由CSDN通过智能技术生成

在掌握了浅层神经网络算法后，对深度神经网络进行学习。

1. 原理推导

1.1 深度神经网络表示

定义：L表示神经网络总层数，上标[l]代表第l层网络，n^[l]代表第l层的节点数，a^[l]代表第l层的激活，W^[l]和b^[l]为第l层的参数。输入层为第0层a^[0] = x，输出层为第L层a^[L]。

1.2 正向传播(Forward Propagation)

类似浅层神经网络的推导可以得到，对于第l层，针对单个样本，正向传播可以表示为：
${z^{\left[ l \right]}} = {W^{\left[ l \right]}}{a^{\left[ {l - 1} \right]}} + {b^{\left[ l \right]}},\;\;{a^{\left[ l \right]}} = {g^{\left[ l \right]}}\left( {{z^{\left[ l \right]}}} \right)\tag{1}$
式中，g^[l](z^[l])为第l层的激活函数，且a^[0] = x。针对m个样本，以上标(m)表示第m个样本，将上式改写为：
${Z^{\left[ l \right]}} = {W^{\left[ l \right]}}{A^{\left[ {l - 1} \right]}} + {b^{\left[ l \right]}},\;\;{A^{\left[ l \right]}} = {g^{\left[ l \right]}}\left( {{Z^{\left[ l \right]}}} \right)\tag{2}$
式中，A^[0] = X，
Z[l]=⎡⎣⎢|z[l](1)||z[l](2)||⋯||z[l](m)|⎤⎦⎥,A[l]=⎡⎣⎢|a[l](1)||a[l](2)||⋯||a[l](m)<

最低0.47元/天解锁文章

tu天马行空

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
Coursera deeplearning.ai 深度学习笔记1-4-Deep Neural Networks-深度神经网络原理推导与代码实现

Coursera deeplearning.ai 深度学习笔记1-4-Deep Neural Networks-深度神经网络原理推导与代码实现
复制链接

扫一扫