机器学习之logistic回归

lankuohsing

已于 2022-06-18 00:08:29 修改

阅读量534

点赞数

分类专栏：理论学习学习笔记文章标签：机器学习

于 2017-06-28 00:30:12 首次发布

本文链接：https://blog.csdn.net/THUChina/article/details/73825187

版权

学习笔记同时被 2 个专栏收录

53 篇文章

订阅专栏

理论学习

46 篇文章

订阅专栏

@(机器学习)[回归]
#logistic回归
在**《机器学习之线性回归模型》一章中，我们学习了如何使用线性模型进行回归学习。如果要将线性模型用来分类，就要用到该章结尾介绍的广义线性模型了。
logistic回归模型采用logistic函数来将线性回归产生的预测值 $z=\boldsymbol{w}^T\boldsymbol{x}+b$ 转化为一个接近0或1的 $y$ 值;
$y=\frac{1}{1+e^{-z}} \tag{1}$
由此得到logistic回归模型：
$y=\frac{1}{1+e^{-(\boldsymbol{w}^T\boldsymbol{x}+b)}} \tag{2}$
假设我们的训练集是由 $m$ 个已标记的样本构成： $\{(x^{(1)},y^{(1)}),\cdots,(x^{(m)},y^{(m)}),\}$ ，输入特征向量 $\boldsymbol{x}^{(i)}\in \mathbb{R}^{n+1}$ 。（我们约定其中 $x_0=1对应截距项$ ）。
我们将用于分类的函数称为假设函数**（hypothesis function），logistic回归中的假设函数为：
$h_\theta=\frac{1}{1+e^{(-\theta^Tx)}} \tag{3}$
注意， $(3)$ 中的 $\theta$ 等价于 $[w; b]$ 。
我们可以通过“极大似然法”（maximum likelihood method）来估计 $\theta$ 。不妨设：
$\begin{aligned} P(y=1|x;\theta) &=h_\theta(x) \\ P(y=0|x;\theta) &=1-h_\theta(x) \\ \tag{4} \end{aligned}$
那么有
$P(y|x;\theta)=(h_\theta(x))^y(1-h_\theta(x))^{1-y} \tag{5}$
似然函数为：
$\begin{aligned} L(\theta) &=P(\boldsymbol{Y}|\boldsymbol{X};\theta) \\ &=\prod_{i=1}^{m}P(y^{(i)}|x^{(i)};\theta) \\ &=\prod_{i=1}^{m}(h_\theta(x^{(i)}))^{y^{(i)}}(1-h_\theta(x^{(i)}))^{1-y^{(i)}}\\ \tag{6} \end{aligned}$
对数似然函数为：
$\begin{aligned} l(\theta) &=\log L(\theta) \\ &=\sum_{i=1}^{m}y^{(i)}\log h_\theta(x^{(i)})+(1-y^{(i)})\log (1-h_\theta(x^{(i)}))\\ \tag{7} \end{aligned}$
我们将训练模型参数 $\theta$ 使其能够最小化代价函数：
$J(\theta)=-\frac{1}{m}\left[\sum_{i=1}^{m}y^{(i)}\log h_\theta(x^{(i)})+(1-y^{(i)})\log (1-h_\theta(x^{(i)}))\right] \tag{8}$