机器学习入门 --- 逻辑回归算法（公式推导）

最新推荐文章于 2024-05-29 16:42:20 发布

Ry风度

最新推荐文章于 2024-05-29 16:42:20 发布

阅读量680

点赞数 1

分类专栏： python 机器学习文章标签： python 机器学习算法

本文链接：https://blog.csdn.net/qq_42549612/article/details/105154346

版权

python 同时被 2 个专栏收录

22 篇文章 10 订阅

订阅专栏

机器学习

18 篇文章 2 订阅

订阅专栏

逻辑回归算法原理

逻辑回归算法是一个分类算法，经典的二分类算法
在机器学习中，关于算法的选择：先逻辑回归再用复杂的，能简单还是用简单的
逻辑回归的决策边界：可以是线性的，也可以是非线性的

Sigmoid 函数

公式：
$g(z)=\frac{1}{1+e^{-z}}$

特点：自变量取值为任意实数，值域[0,1]

解释：将任意的输入映射到了[0,1]区间我们在线性回归中可以得到一个预测值，再将该值映射到Sigmoid 函数中这样就完成了由值到概率的转换，也就是分类任务

简化与求解

预测函数：
$h_\theta (x) = g(\theta ^Tx)=\frac{1}{1+e^{-\theta ^Tx}}$

其中 $\theta_0+\theta_1x_1+...\theta_n+x_n = \sum_{i=1}^{n}\theta_ix_i = \theta^Tx$

分类任务：
$\begin{aligned} P(y = 1|x;\theta) &= h_\theta(x) \\ P(y = 0|x;\theta) &= 1-h_\theta(x) \end{aligned}$
对于这两个公式的整合公式如下：
$P(y=1|x;\theta) = (h_\theta(x))^y(1-h_\theta(x))^{1-y}$
就上述公式而言，对于二分类任务（0，1），整合后：
$y$ 取1只保留 $h_\theta(x)$
$y$ 取0只保留 $1-h_\theta(x)$

似然函数：
$L(\theta) = \prod_{i=1}^{m}P(y_i|x_i;\theta)=\prod_{i=1}^{m}(h_\theta(x_i))^{y_i}(1-h_\theta(x_i))^{1-y_i}$
对数似然：
$l(\theta)=logL(\theta) =\sum _{i=1}^{m}[y_ilogh_\theta(x_i)+(1-y_i)log(1-h_\theta(x_i))]$
对于此公式，我们想要达到目标需要应用梯度上升求最大值，所以在这里还需要一点小变动，引入 $J(\theta)=-\frac{1}{m}l(\theta)$ 转化为梯度下降求解

求偏导：
$\begin{aligned} l(\theta)=logL(\theta) &=\sum _{i=1}^{m}[y_ilogh_\theta(x_i)+(1-y_i)log(1-h_\theta(x_i))] \\ \frac{\partial J（\theta )}{\partial \theta_j} &=-\frac{1}{m}\sum_{i=1}^{m}[y_i\frac{1}{h_\theta(x_i)}\frac{\partial h_\theta(x_i)}{\partial \theta_j}-(1-y_i)\frac{1}{1-h_\theta(x_i)}\frac{\partial h_\theta(x_i)}{\partial \theta_j}] \\ &=\frac{1}{m}\sum_{i=1}^{m}(h_\theta(x_i)-y_i)x_i^j \end{aligned}$
上面的步骤与线性回归的推导方法类似，但线性回归是根据此目标函数直接求解，逻辑回归算法在获得了目标函数之后再进行梯度下降来优化参数
参数更新公式：
${\theta}'_j = \theta_j-\alpha\frac{1}{m}\sum_{i=1}^{m}(h_\theta(x_i)-y_i)x_i^j$

Ry风度

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
机器学习入门 --- 逻辑回归算法（公式推导）

逻辑回归算法原理逻辑回归算法是一个分类算法，经典的二分类算法在机器学习中，关于算法的选择：先逻辑回归再用复杂的，能简单还是用简单的逻辑回归的决策边界：可以是线性的，也可以是非线性的Sigmoid 函数公式：g(z)=11+e−zg(z)=\frac{1}{1+e^{-z}}g(z)=1+e−z1特点：自变量取值为任意实数，值域[0,1]解释：将任意的输入映射到了[0,1]...
复制链接

扫一扫

专栏目录