《吴恩达深度学习》01神经网络和深度学习（第2周神经网络基础）

最新推荐文章于 2021-08-13 11:16:52 发布

ZJ_Windy_Feng

最新推荐文章于 2021-08-13 11:16:52 发布

阅读量185

点赞数

分类专栏：深度学习理论学习

本文链接：https://blog.csdn.net/fzj0121/article/details/105191123

版权

深度学习理论学习专栏收录该内容

15 篇文章 0 订阅

订阅专栏

01. 神经网络和深度学习

第二周神经网络基础

2.1 二分分类

图片在计算机中的保存：三通道（红，绿，蓝）
$X=[x^{(1)},x^{(2)},\cdots,x^{(m)}]$ ，每个列向量为一个样本。

2.2 logistic回归

给定 $x$ ，目的是求 $\hat{y}=P(y=1|x)$ 。
sigmoid函数
$\sigma(z)=\frac{1}{1+e^{-z}}$
logistic回归
$\hat{y} = \sigma(w^{T}+b)$

2.3 logistic回归损失函数

平方损失函数（在logistic中不常用，因为会导致非凸）
$L(\hat{y}, y) = \frac{1}{2}(\hat{y}-y)^2$
熵损失函数
$L(\hat{y}, y)=-(y log \hat{y}+ (1-y)log(1-\hat{y}))$
成本函数
$b)=\frac{1}{m}\sum_{i=1}^{m}L(\hat{y}^{(i)}, y^{(i)})$

2.4 梯度下降法

流程
$w-\alpha \frac{\partial J(w, b)}{\partial w}$
$b-\alpha \frac{\partial J(w,b)}{\partial b}$

2.5 导数

2.6 更多导数的例子

2.7 计算图

举例： $J (a, b, c) = 3 (a + b c)$

2.8 计算图的导数计算

计算图
链式法则
代码中常用变量：dvar，最终关心的输出变量的导数

2.9 logistic回归中的梯度下降法

计算图

2.10 m个样本的梯度下降

$dw_1 =0; dw_2=0;db=0\\ for i =1 to m\\ z^{(i)} = w^T x^{(i)} +b\\ a^{(i)} = \sigma (z^{(i)})\\ J += -[y^{(i)}loga^{(i)}+ (1-y^{(i)})log(1-a^{(i)})]\\ dz^{(i)} = a^{(i)}-y^{(i)}\\ dw_1 += x_1^{(i)}dz^{(i)}\\ dw_2 += x_2^{(i)}dz^{(i)}\\ db += dz^{(i)}\\ J /= m\\ dw_1 /=m, dw_2 /=m, db/=m;$
2. 问题：两次for循环，较为低效
3. 解决方法：向量化

2.11 向量化

什么是向量化
$z=w^T x+b$
非向量化代码
$\\ for i in range(n-x): z += w[i]*x[i] z+= b$
向量化代码
$z = n p . d o t (w, x)$

2.12 向量化的更多例子

神经网络编程指南
(1) 只要可能，尽量少用for循环；
numpy常用函数：log, abs, maximum,**
向量化logistic梯度下降

2.13 向量化logistic回归

$Z=w^T X+b$
$Z = n p . d o t (w . T, X) + b$
$\sigma(Z)$

2.14 向量化logistic回归的梯度输出

$[dz^{(1)}, dz^{(2)}, \cdots, ^{(m)}]$
$d z = A - Y$
$\frac{1}{m}np.sum(dZ)$
$\frac{1}{m}Xdz^T$

2.15 Python中的广播

广播可以使python运行更搞笑
例子（求每种食物中热量占比）
代码
$c a l = A . s u m (a x i s = 0)$
$p e r c e n t a g e = 100 * A / (c a l . r e s h a p e (1, 4))$
增加reshape确保矩阵维度正确
广播举例
广播通用规则
$\rightarrow (m,n)$
$\rightarrow (m,n)$
$\rightarrow (m,1)$
$\rightarrow (1,n)$

2.16 关于python numpy向量的说明

不要使用 $(n,)$ 形式的数据结构
例子： $\rightarrow a=np.random.randn(5,1)$
使用声明
例子： $a s s e r t (a . s h a p e = = (5, 1))$
重塑矩阵
例子： $a = a . r e s h a p e ((5, 1))$

2.17 Jupyter ipython笔记本的快速指南

2.18 logistic损失函数的解释

ZJ_Windy_Feng

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《吴恩达深度学习》01神经网络和深度学习（第2周神经网络基础）

01. 神经网络和深度学习第二周神经网络基础2.1 二分分类图片在计算机中的保存：三通道（红，绿，蓝）X=[x(1),x(2),⋯ ,x(m)]X=[x^{(1)},x^{(2)},\cdots,x^{(m)}]X=[x(1),x(2),⋯,x(m)]，每个列向量为一个样本。2.2 logistic回归给定xxx，目的是求y^=P(y=1∣x)\hat{y}=P(y=1|x)y...
复制链接

扫一扫