第三周：浅层神经网络

最新推荐文章于 2021-09-24 19:17:07 发布

SuperFeHanHan

最新推荐文章于 2021-09-24 19:17:07 发布

阅读量79

点赞数

分类专栏：神经网络和深度学习(Andrew Ng)

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44495738/article/details/107589951

版权

第三周：浅层神经网络

3.0 重要的结论：
3.1 神经网络概览
3.2 神经网络表示
3.3 计算神经网络的输出
3.4 多样本向量化
3.6 激活函数
3.7 为什么需要非线性激活函数？
3.8 激活函数的导数
3.9 / 3.10 神经网络的梯度下降法
- 对于单个样本:
- 对于多个样本:
3.11 随机初始化

本文是神经网络和深度学习课程的笔记。

3.0 重要的结论：

参数更新：
单个样本
1. 第k层的输出: $a^{[z]}=g(z^{[k]}),z^{[k]}=w^{[k]}a^{[k-1]}+b^{[k]}$ ，
  其中 $w^{[k]}.shape=(n^{[k]},n^{[k-1]})$
  $b^{[k]}.shape=(n^{[k]},1)$
  $z^{[k]}.shape=(n^{[k]},1)$
  $a^{[k]}.shape=(n^{[k]},1)$
2. 参数更新：
  - $dz^{[k]}= \frac{\partial LOSS}{\partial z^{[k+1]}} \frac{\partial z^{[k+1]}}{\partial a^{[k]} } * \frac{\partial a^{[k]}}{\partial z^{[k]}}=w^{[k+1],T}dz^{[k+1]} *g'(z^{[k]})$ ,因为 $a^{[k]}=g(z^{[k]}),z^{[k+1]}=w^{[k+1]}a^{[k]}+b^{[k+1]}$ *表示对应元素相乘。
  - $dw^{[k]}=dz^{[k]}a^{[k-1],T}$
  - $db^{[k]}=dz^{[k]}$
3. 具体实现
  $dz^{[2]}=a^{[2]}-y$ 鉴于g(z)为sigmoid
  $dW^{[2]}=dz^{[2]}a^{[1],T}$
  $db^{[2]}=dz^{[2]}$
  $dz^{[1]}=W^{[2],T}dz^{[2]}*g^{[1]'}(z^{[1]})$
  $dW^{[1]}=dz^{[1]}a^{[0],T}=dz^{[1]}x^{T}$
  $db^{[1]}=dz^{[1]}$
多个样本
- 通过将多个样本横着挤在一起： $x^{(1)},...x^{(n)}]$ 引入 $X,Y,A^{[n]},Z^{[n]}$
  从而具体实现为：
  $dZ^{[2]}=A^{[2]}-Y$ 鉴于g(z)为sigmoid
  $dW^{[2]}=\frac{1}{m}dZ^{[2]}A^{[1],T}$ 因为Cost Function里面有一个 $\frac{1}{m}$
  $db^{[2]}=\frac{1}{m} np.sum(dZ^{[2]},axis=1,keepdims=True)$

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
第三周：浅层神经网络

第三周：浅层神经网络3.0 重要的结论：3.1 神经网络概览3.2 神经网络表示3.3 计算神经网络的输出3.4 多样本向量化3.6 激活函数3.7 为什么需要非线性激活函数？3.8 激活函数的导数3.9 / 3.10 神经网络的梯度下降法对于单个样本:对于多个样本:3.11 随机初始化本文是神经网络和深度学习课程的笔记。3.0 重要的结论：参数更新：单个样本第k层的输出: a[z]=g(z[k]),z[k]=w[k]a[k−1]+b[k]a^{[z]}=g(z^{[k]}),z^{[k]
复制链接

扫一扫

专栏目录

SuperFeHanHan CSDN认证博客专家 CSDN认证企业博客

码龄6年

149: 原创

3万+: 周排名

118万+: 总排名

9万+: 访问

: 等级

1640: 积分

937: 粉丝

46: 获赞

30: 评论

307: 收藏

私信

关注

热门文章

分类专栏

最新评论

ROS从入门到放弃——用TurtleBot3做Navigation模拟
qq_45501854: 这个地图重合之后点2D nav goal之后又变不重合了是咋弄
强化学习实践 | DQN和OpenAI Gym中的CartPole
B.RLBL: 博主您好，遇到这个问题是什么原因呢？ "D:\Program Files (x86)\python.exe" E:/19-python/reinforcementv4/main.py Collecting experience... i=0 memory_counter = 0 E:\19-python\reinforcementv4\main.py:57: UserWarning: Creating a tensor from a list of numpy.ndarrays is extremely slow. Please consider converting the list to a single numpy.ndarray with numpy.array() before converting to a tensor. (Triggered internally at C:\actions-runner\_work\pytorch\pytorch\builder\windows\pytorch\torch\csrc\utils\tensor_new.cpp:233.) x = torch.unsqueeze(torch.FloatTensor(x),0) # shape [N_STATES]->[1,N_STATES] Traceback (most recent call last): File "E:\19-python\reinforcementv4\main.py", line 111, in <module> a = dqn.choose_action(s) File "E:\19-python\reinforcementv4\main.py", line 57, in choose_action x = torch.unsqueeze(torch.FloatTensor(x),0) # shape [N_STATES]->[1,N_STATES] ValueError: expected sequence of length 4 at dim 1 (got 0)
ROS从入门到放弃 —— 玩一玩F1TENTH
喜欢刀刀的来来: 225 degrees为啥是7*pi/4呀
DEPRECATION: Python 2.7 reached the end of its life on January 1st, 2020.
weixin_52075343: 按：wq退出那步先按下esc键
DEPRECATION: Python 2.7 reached the end of its life on January 1st, 2020.
m0_71748864: 好像没有解决

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。