Logistic回归/线性Logistic分类器

「已注销」

已于 2023-11-27 00:51:11 修改

阅读量1k

点赞数

分类专栏：机器学习(Machine Learning, ML) 文章标签：人工智能算法分类

于 2023-11-27 00:06:15 首次发布

本文链接：https://blog.csdn.net/Jiayyyiii/article/details/134635735

版权

机器学习(Machine Learning, ML) 专栏收录该内容

2 篇文章 1 订阅

订阅专栏

Logistic回归（Logistic Regression, LR）- 线性Logistic分类器

线性Logistic分类器（linear logistic classifier, LLC）是以下形式的二元分类器：
$h(\bold{x};\bold{w},b)= \begin{cases} +1& \text{if} \ \ \sigma(u(\bold{x})) > \sigma_{threshold}\\ -1& \text{otherwise} \end{cases}$

threshold 一般为 0.5。
我们将其称为线性分类器，是因为它内部的函数 $u(\bold{x}) = \bold{w}^\top\bold{x} + b$ 是线性的。
而称为逻辑分类器，是因为外部的函数 $\sigma(z) = \frac{1}{1+e^{-z}}$ 是逻辑函数。

Sigmoid/Logistic函数

$\sigma(z) = \frac{1}{1+e^{-z}}$

在这里插入图片描述

取值范围在0到1之间，即 $\leq \sigma(z) \leq 1$ 。在二分类问题中可以将预测值映射到0和1之间的概率。
平滑函数，即在整个定义域上都是连续可导的。可以进行梯度下降等优化方法。

LLC的损失函数 - 负对数似然函数（Negative Log Likelihood, NLL）

定义预测概率为： $g^{(i)} = \sigma(\bold{w}^\top\bold{x}+b)$ ，这里 $\sigma(z) = \frac{1}{1+e^{-z}}$

则数据集 $\mathscr{D}_n$ 的概率 $\prod_{i=1}^n \begin{cases} g^{(i)}& \text{if} \ \ y^{(i)}=1\\ 1-g^{(i)}& \text{else} \end{cases}$

将 $P$ 重写为 $\prod_{i=1}^n g^{{(i)}^{y^{(i)}}}(1 - g^{(i)})^{(1-y^{(i)})}$ ，两边取对数
$\log P = \sum_{i=1}^n (y^{(i)}\log g^{(i)} + (1-y^{(i)})\log (1- g^{(i)}))$

我们最小化 $\sum_{i=1}^n L_{nll}(g^{(i)}, y^{(i)})$ ，其中
$L_{nll} (g^{(i)}, y^{(i)}) = -(y^{(i)}\log g^{(i)} + (1-y^{(i)})\log (1- g^{(i)}))$

负对数似然函数（Negative Log Likelihood, NLL）写作：

$L_{nll} (g, y) = -(y\log g + (1-y)\log (1- g))$

也称为 log loss 或 交叉熵(cross entropy)损失函数

机器学习问题：LLC

数据集： $\mathscr{D}_n = \{(\bold{x}^{(1)}, y^{(1)}),\cdots,(\bold{x}^{(n)}, y^{(n)})\}$
假设空间： $\mathscr{H} = \{h(\bold{x};\bold{w},b) = \sigma(\bold{w}^\top\bold{x}+b)\}$
损失函数： $L_{nll} (g^{(i)}, y^{(i)}) = -(y^{(i)}\log g^{(i)} + (1-y^{(i)})\log (1- g^{(i)}))$

目标函数（代价函数）：
$J_{lr}(\bold{w},b;\mathscr{D}_n) = \frac{1}{n}\sum_{i=1}^nL_{nll}(\sigma(\bold{w}^\top\bold{x}+b), y^{(i)}) + \lambda\Vert\bold{w}\Vert^2$

最小化目标函数：

求解使目标函数 $J_{lr}$ 取最小值的参数 $\bold{w},b$
目标函数 $J_{lr}$ 不一定有解析解，可以用梯度下降或随机梯度下降方法

LR的梯度下降法

LR-Gradient-Descent( $\bold{w}_{init}, b_{init}, \eta, \epsilon$ )

Initialize

$\bold{w}^{(0)}=\bold{w}_{init}$

$b^{(0)}=b_{init}$

$t = 0$

Repeat

$t = t + 1$

$\bold{w}^{(t)}=\bold{w}^{(t-1)} - \eta\{ \frac{1}{n}\sum_{i=1}^n[\sigma(\bold{w}^{(t-1)\top}\bold{x}+b^{(t-1)})-y^{(i)}]\bold{x}^{(i)} + 2\lambda\bold{w}^{(t-1)} \}$

$b^{(t)} = b^{(t-1)} - \eta\{ \frac{1}{n}\sum_{i=1}^n[\sigma(\bold{w}^{(t-1)\top}\bold{x}+b^{(t-1)})-y^{(i)}] \}$

Until $J_{lr}(\bold{w}^{(t)}, b^{(t)}) - J_{lr}(\bold{w}^{(t-1)}, b^{(t-1)}) < \epsilon$

Return $\bold{w}^{(t)}, b^{(t)}$

「已注销」

关注

0
点赞
踩
21

收藏

觉得还不错? 一键收藏
打赏
0
评论
Logistic回归/线性Logistic分类器

hx;wb1−1ifσux))σthresholdotherwisethreshold 一般为 0.5。我们将其称为线性分类器，是因为它内部的函数uxw⊤xb是线性的。而称为逻辑分类器，是因为外部的函数σz1e−z1是逻辑函数。
复制链接

扫一扫