逻辑斯蒂回归模型

最新推荐文章于 2022-11-02 11:30:00 发布

cofisher

最新推荐文章于 2022-11-02 11:30:00 发布

阅读量696

点赞数 1

分类专栏：机器学习文章标签：逻辑回归

本文链接：https://blog.csdn.net/qq_36758914/article/details/103370242

版权

机器学习专栏收录该内容

23 篇文章 8 订阅

订阅专栏

逻辑回归是线性回归的拓展形式，主要用来解决二分类问题 $(0 / 1)$ 。

线性回归

线性回归公式：
$\theta ^{T}x=\theta _{1}x+\theta _{2}x+……+\theta _{n}x$
其中 $x\in R^{n}$ 。

逻辑回归

将线性函数的输出压缩进区间 $(0, 1)$ 。
该值可以解释为概率：
$P{(y|x;\theta)}=\sigma_{(\theta ^{T}x)}$
其中 $\sigma_{()}$ 函数被称为 $s i g m o i d$ 函数或 $l o g i s t i c$ 函数，其表达式为：
$\sigma_{(x)}=\frac{1}{1+e^{-x}}$
其图像为：
在这里插入图片描述

逻辑斯蒂回归模型

逻辑斯蒂回归模型是如下的条件概率分布：
$P{(Y=1|x)}=\frac{e^{\omega x+b}}{1+e^{\omega x+b}}$
$P{(Y=0|x)}=\frac{1}{1+e^{\omega x+b}}$
其中， $x\in R^{n}$ 是输入， $Y\in [0,1]$ 是输出，权重向量 $\omega \in R^{n}$ ，偏置 $b\in R$ 。
为了简化等式，将权重向量和输入向量加以扩充，仍记作 $\omega ,x$ ，即 $\omega=(\omega^{(1)},\omega^{(2)},…,\omega^{(n)},b)^{T},x=(x^{(1)},x^{(2)},…,x^{(n)},1)^{T}$ 。这时，逻辑斯蒂回归模型为：
$P{(Y=1|x)}=\frac{e^{\omega x}}{1+e^{\omega x}}$
$P{(Y=0|x)}=\frac{1}{1+e^{\omega x}}$
记 $P{(Y=1|x)}=\pi_{(x)},P{(Y=0|x)}=1-\pi_{(x)}$ 。
对于给定的训练数据集 $T=[(x_{1}, y_{1}),(x_{2}, y_{2}),…,(x_{N}, y_{N})]$ ，其中， $x_{i}\in R^{n}$ ， $y_{i}\in [0,1]$ ，可以运用极大似然估计法估计模型参数 $\omega$ 。
因为 $P{(Y=1|x)}=\pi_{(x)},P{(Y=0|x)}=1-\pi_{(x)}$ ，则似然函数为：
$L_{(\omega)}=\prod^{N}_{i=1}[\pi_{(x_{i})}]^{y_{i}}[1-\pi_{(x_{i})}]^{1-y_{i}}$
取对数得：
$L_{(\omega)}=\sum^{N}_{i=1}[y_{i}log(\pi_{(x_{i})})+(1-y_{i})log(1-\pi_{(x_{i})})]$
$=\sum^{N}_{i=1}[y_{i}log\frac{\pi_{(x_{i})}}{1-\pi_{(x_{i})}}+log(1-\pi_{(x_{i})})]$
$=\sum^{N}_{i=1}[y_{i}(\omega x_{i})-log(1+e^{\omega x_{i}})]$
对 $L_{(\omega)}$ 求极大值，得到 $\omega$ 的估计值。
$\frac{\partial L_{(\omega)}}{\partial \omega}=\sum^{N}_{i=1}[y_{i}x_{i}-\frac{e^{\omega x_{i}}}{1+e^{\omega x_{i}}}x_{i}]=0$
而这是一个超越方程，不可解。
对于求极大值问题，可以转化为求其负数的极小值问题，并使用梯度下降法求得最优解。
此处， $\frac{\partial L_{(\omega)}}{\partial \omega}$ 即为梯度。
设初始 $\omega$ 为 $\omega_{0}$ ，则：
$\omega_{1}=\omega_{0}-\alpha \frac{\partial L_{(\omega_{0})}}{\partial \omega_{0}}$
循环不断更新 $\omega$ 知道取得最优值。
而此时每计算一次梯度都需要遍历一遍样本，计算量十分巨大，占用内存过大。
所以，对于大规模样本，可以使用随机梯度下降法 $(S G D)$ ，即每次只取总样本中的 $b a t c h$ 个样本进行一次梯度下降，其优点为更新梯度更快，占用内存更少。

cofisher

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
逻辑斯蒂回归模型

逻辑回归是线性回归的拓展形式，主要用来解决二分类问题(0/1)(0/1)(0/1)。线性回归线性回归公式：θTx=θ1x+θ2x+……+θnx\theta ^{T}x=\theta _{1}x+\theta _{2}x+……+\theta _{n}xθTx=θ1x+θ2x+……+θnx其中x∈Rnx\in R^{n}x∈Rn。逻辑回归将线性函数的输出压缩进区间(0,1)(0, 1...
复制链接

扫一扫