手推线性回归与逻辑回归（两个LR，linear regression；logistic regression）

最新推荐文章于 2021-01-26 15:20:44 发布

titake

最新推荐文章于 2021-01-26 15:20:44 发布

阅读量253

点赞数 1

分类专栏： machine learning

本文链接：https://blog.csdn.net/qq_22498427/article/details/105040103

版权

machine learning 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

一开始看统计学习方法上的手推LR，那个最大似然函数那看的晕晕乎乎的。这两天又看了这个大哥讲的空间和概率上定义LR的目标函数，以及求解。清晰很多

1、线性回归 Linear Regression

1.1、目标函数的定义

1.1.1 空间角度

和SVM一样，首先定义目标函数。SVM是从空间考虑，点到超平面的最小距离最大。LR的空间考虑很直观，最小各点到回归线的距离之和。
$\sum_{i=1}^{N}||w^Tx_i-y_i||^2$

1.1.2 概率角度

概率角度就是统计学习方法的最大似然了。
什么是最大似然呢？就是让事情A发生的最大概率的模型参数。
我们认为各样本点相互独立，那么总模型的似然函数（概率）为各个样本点的概率乘积。再对其求log

$log\left(\prod_{i=1}^N P(y_i|x_i,w)\right) = \sum_{i=1}^Nlog\left(P(y_i|x_i,w)\right)$
这里认为 $(y ∣ w, x)$ 服从均值为 $w x$ ，方差为 $\sigma^2$ 的正太分布，所以有
$P(y_i|x_i,w) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(y_i-w^Tx_i)^2}{2\sigma^2}}$
因此目标函数为：
$\sum_{i=1}^Nlog\left(P(y_i|x_i,w)\right)\\ =max \sum_{i=1}^{N} \left(log(\frac{1}{\sqrt{2\pi}\sigma})+log(e^{-\frac{(y_i-w^Tx_i)^2}{2\sigma^2}})\right)\\ =max \sum_{i=1}^{N} \left(-log(\sqrt{2\pi}\sigma)-\frac{(y_i-w^Tx_i)^2}{2\sigma^2}\right)\\$
这里 $\sigma$ 是常数，所以可以约去，目标函数就变为了：
$\sum_{i=1}^{N} \left(-{(y_i-w^Tx_i)^2}\right)\\ = min \sum_{i=1}^{N}(y_i-w^Tx_i)^2\\$ 和上面基于空间的目标函数是一样的。
$\\[28pt]$

1.2、线性回归的目标函数求解

这个目标函数没有约束很好求，直接求导
$\frac{\partial \mathcal{L}}{\partial w} = \frac{\partial \sum_{i=1}^{N}(y_i-w^Tx_i)^2}{\partial w} =0$
这里，把 $x$ 和 $y$ 写成列向量：
$\left[\begin{array}{cccc} | & | & & | \\ x_{1} & x_{2} & \ldots & x_{N} \\ | & | & & | \end{array}\right]\qquad Y=\left[\begin{array}{cccc} y_1\\ y_2\\ ...\\ y_N \end{array}\right]$
那么：
$\sum_{i=1}^{N}(y_i-w^Tx_i)^2 = (Y-w^TX)^2\\[4pt] =Y^TY-2w^TXY+w^TXX^Tw$
求导：
$\frac{\partial \mathcal{L}}{\partial w} = \frac{\partial (Y^TY-2w^TXY+w^TXX^Tw)}{\partial w} \\[4pt] = -2XY + 2XX^Tw =0$
所以：
$w = (XX^T)^{-1}XY$
这样就求出了线性回归方程

2、逻辑斯蒂回归

我们说的逻辑回归，就是二项的逻辑斯蒂回归。
这里认为Y 服从logistic 分布：
$\frac{e^{w^Tx+b}}{1+e^{w^Tx+b}}$
用极大似然估计,得到目标函数：
$max\,\, log \prod_{i=1}^NP(y_i|x_i)$
这里:
$P(y_i|x_i) = P(1|x_i)^{y_i}P(0|x_i)^{1-y_i}$
我们先用 $\pi(x_i)$ 来表示 $P(1|x_i)$ , 化简目标函数：
$\,\,log \prod_{i=1}^N\pi(x_i)^{y_i}\left(1-\pi(x_i)\right)^{1-y_i} \\ =max \sum_{i=1}^Ny_ilog(\pi(x_i))+(1-y_i)log(1-\pi(x_i))\\$
然后把 $\pi(x_i)$ 的值带入化简得：
$\,\sum_{i=1}^N\left[ y_i(w^Tx_i+b)-log(1+e^{w^Tx_i+b})\right]$
然后可以用梯度下降等方法，去求解最优的 $w$ 和 $b$

titake

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
手推线性回归与逻辑回归（两个LR，linear regression；logistic regression）

一开始看统计学习方法上的手推LR，那个最大似然函数那看的晕晕乎乎的。这两天又看了这个大哥讲的空间和概率上定义LR的目标函数，以及求解。清晰很多1、线性回归 Linear Regression1.1、目标函数的定义1.1.1 空间角度和SVM一样，首先定义目标函数。SVM是从空间考虑，点到超平面的最小距离最大。LR的空间考虑很直观，最小各点到回归线的距离之和。min∑i=1N∣∣wTxi−...
复制链接

扫一扫