逻辑回归的梯度下降计算

最新推荐文章于 2023-07-31 20:30:58 发布

tigerlib

最新推荐文章于 2023-07-31 20:30:58 发布

阅读量493

点赞数

分类专栏： machine learning 文章标签：逻辑回归

本文链接：https://blog.csdn.net/weixin_44695969/article/details/102888984

版权

machine learning 专栏收录该内容

18 篇文章 0 订阅

订阅专栏

目的：找到损失函数的最小值；方法：梯度下降
$z = w^Tx + b$
$\hat{y} =a= \sigma(z)$

损失函数

单个训练样本的损失函数：

$L(\hat{y},y) = -(y\log\hat{y})-(1-y)\log(1-\hat{y})$

$L(a,y) = -(y\log{a})-(1-y)\log(1-a)$

全体训练样本的损失函数：
$\frac{1}{m}\sum_{i=1}^mL(\hat{y}^{(i)},y^{(i)})$

梯度下降过程计算（注意字母大小写）

单个训练样本，参数w和b的更新公式为：
$\alpha\frac{\partial J(w, b)}{\partial w}，b := b - \alpha\frac{\partial J(w, b)}{\partial b}$
全体训练样本，参数 $W$ 和 $b$ 的更新公式为：
$\alpha dW，b := b - \alpha db$
计算 $J$ 关于 $z$ 的导数：
$\frac{\partial J}{\partial a}=-\frac{y}{a} + \frac{1-y}{1-a}$

$a=\sigma(z) = \frac{1}{1+e^{-z}} \implies \sigma(z)^\prime=\sigma(z)(1-\sigma(z)) \implies \frac{\partial a}{\partial z} =a(1-a)$

$\implies dz =\frac{\partial J}{\partial z}= \frac{\partial J}{\partial a}*\frac{\partial a}{\partial z} = (-\frac{y}{a} + \frac{1-y}{1-a}) * a(1-a) = a-y$

计算 $J$ 关于 $W$ 的导数：
$dw=\frac{\partial J}{\partial w}= \frac{\partial J}{\partial a}*\frac{\partial a}{\partial z} * \frac{\partial z}{\partial w}=dz*x=xdz\implies dW=\frac{\partial J}{\partial W}=\frac{1}{m}XdZ^T$
计算 $J$ 关于 $b$ 的导数：
$db=\frac{\partial J}{\partial b}= \frac{\partial J}{\partial a}*\frac{\partial a}{\partial z} * \frac{\partial z}{\partial b}=dz*1=dz\implies db=\frac{1}{m}np.sum(dZ)$

tigerlib

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
逻辑回归的梯度下降计算

目的：找到损失函数的最小值；方法：梯度下降z=wTx+bz = w^Tx + bz=wTx+by^=a=σ(z)\hat{y} =a= \sigma(z)y^=a=σ(z)损失函数单个训练样本的损失函数：L(y^,y)=−(ylog⁡y^)−(1−y)log⁡(1−y^)L(\hat{y},y) = -(y\log\hat{y})-(1-y)\log(1-\hat{y})L(...
复制链接

扫一扫

专栏目录