一、神经网络基础（吴恩达深度学习笔记）

积极向上的森森同学

已于 2023-07-29 17:58:50 修改

阅读量72

点赞数

分类专栏：吴恩达DL学习笔记文章标签：深度学习笔记

于 2023-07-29 17:57:34 首次发布

本文链接：https://blog.csdn.net/m0_50674282/article/details/131995558

版权

吴恩达DL学习笔记专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一、算法基础与逻辑回归

1、二分类问题
目标是训练出一个分类器，输入是图片的特征向量x。预测输出的结果标签y是1还是0，也就是图片中是否有猫。

符号规定：
（训练集由m个训练样本构成）
输入的特征向量x（n维向量）
X（nx，m）
标签y（0或1）
权重w（n维向量）
偏置b∈R（一个实数）
2、逻辑回归算法：
$s=\sigma \left( w^Tx+b \right) =\sigma \left( z \right)=\frac{1}{1+e^{-z}}$
$\sigma()是sigmoid函数$
3、逻辑回归的损失函数
1）损失函数的作用：为了训练logistic回归模型的参数w、b定义了损失函数，用于衡量预测结果和真实值之间的差距。
2）损失函数：均方差损失、对数损失（在逻辑回归中用）
（在逻辑回归中，不使用均方差损失函数而使用对数损失的原因：要得到一个凸的损失函数，梯度下降法才能找到全局最优值，如果得到非凸的损失函数，它会有多个局部最优解，梯度下降法可能找不到全局最优值，给优化带来困难）

二、梯度下降法

1、梯度下降法更新w b值
当cost function是一个凸函数，只有一个全局最优点，由梯度下降的参数更新公式：
$=w-\alpha \frac{dJ\left( w,b \right)}{dw}$
$=b-\alpha \frac{dJ\left( w,b \right)}{db}$
使用cost function衡量参数w b在训练集上的效果，找到cost function尽可能小的w和b

三、计算图

前向传播：从输入到输出，从左到右，由神经网络计算得到预测值输出的过程——预测
反向传播：从输出到输入，基于cost function 对参数w b计算梯度的过程（梯度下降法）——求导

四、逻辑回归中的梯度下降法

1、单个训练样本的logistic回归的梯度下降法

使用一个训练样本 $\left(x^{\left( i \right)},y^{\left( i \right)} \right)\\$ 反向传播计算梯度：
对于a的导数：
$\frac{dJ}{da}=da=-\frac{y}{a}+\frac{1-y}{1-a}\\$
对于z的导数：
$\frac{dJ}{dz}=dz=a-y\\$
对于w1，w2，b的导数
$\frac{dJ}{dw_1}=dw_1=x_1\cdot dz\\$
$\frac{dJ}{dw_2}=dw_2=x_2\cdot dz\\$
$\frac{dJ}{db}=db=dz\\$
再梯度下降得到参数更新公式
$w_1 : =w_1-\alpha \frac{dJ\left( w_1,b \right)}{dw_1}$
$w_2 : =w_2-\alpha \frac{dJ\left( w_2,b \right)}{dw_2}$
$=b-\alpha \frac{dJ\left( w,b \right)}{db}$