找工作之逻辑回归

最新推荐文章于 2021-09-10 21:25:37 发布

Cluluxiu

最新推荐文章于 2021-09-10 21:25:37 发布

阅读量264

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/cluluxiu/article/details/80386185

版权

机器学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

注：本博客定义为学习笔记，为本人通过一些材料和书籍整理而来，或许会有些许心得体会。

线性回归

模型

公式如下：

f (x) = w x + b (0)

$f(x)=wx+b\tag0$
给定一组样本

(x1,y1)(x2,y1)…(xi,yi)…(xn,yn) ( x 1 , y 1 ) ( x 2 , y 1 ) … ( x i , y i ) … ( x n , y n ) $(x_1,y_1)(x_2,y_1)\ldots (x_i,y_i)\ldots (x_n,y_n)$ ，若要用一个函数来拟合所有样本点的y值，可以用公式0来进行拟合。图如下（来自百度百科）：
这里写图片描述

损失函数

L (w, b) = \sum i = 1 n (f (x) - y i) 2

$L(w,b)=\sum_{i=1}^{n}(f(x)-y_i)^2$

最小二乘参数估计

令均方误差最小化，即：

(w *, b *) = arg min (w, b) \sum i = 1 n (f (x i) - y i) 2 = arg min (w, b) \sum i = 1 n (w x i + b - y i) 2

$\begin{aligned}(w^*,b^*)&=\mathop{\arg\min}_{(w,b)}\sum_{i=1}^{n}(f(x_i)-y_i)^2 \\ & =\mathop{\arg\min}_{(w,b)}\sum_{i=1}^{n}(wx_i+b-y_i)^2 \end{aligned}$
分别令L(w,b)对w和b进行微分，令微分为0：

\partial L ( w , b ) \partial w = 0 \partial L ( w , b ) \partial b = 0

$\frac{\partial L(w,b)}{\partial w}=0 \\ \frac{\partial L(w,b)}{\partial b}=0$
求出结果如下：

w b = \sum i = 1 n y i ( x i - x ¯ ) \sum i = 1 n x 2 i - 1 n ( \sum i = 1 n x i ) 2 = 1 n \sum i = 1 n (y i - w x i)

$\begin{aligned}w&=\cfrac {\sum\limits_{i=1}^{n}y_i(x_i-\bar x)}{\sum\limits_{i=1}^{n}x_i^2-\cfrac 1n\left(\sum\limits_{i=1}^{n}x_i\right)^2} \\ b&=\frac 1n\sum_{i=1}^{n}(y_i-wx_i)\end{aligned}$

多元线性回归

f (x i) = w T x + b

$f(x_i)=w^Tx+b$

xi=(xi1;xi2;…;xid) x i = ( x i 1 ; x i 2 ; … ; x i d ) $x_i=(x_{i1};x_{i2};\ldots;x_{id})$
令

w=(w;b) w = ( w ; b ) $w=(w;b)$
同样应用最小二乘法进行参数估计，得

w * = arg min w (y - x w) T (y - x w)

$w^*=\mathop{\arg\min}_w(y-xw)^T(y-xw)$
令

L(w)=(y−xw)T(y−xw) L ( w ) = ( y − x w ) T ( y − x w ) $L(w)=(y-xw)^T(y-xw)$ ，对L(w)求导为0，得：

\partial L ( w ) \partial w = 2 x T (y - x w) = 0

$\frac{\partial L(w)}{\partial w}=2x^T(y-xw)=0$

逻辑回归

模型

P (Y = 1 | x) P (Y = 0 | x) = 1 1 + e - w \cdot x + b = e w \cdot x + b 1 + e w \cdot x + b = 1 - P (Y = 1 | x) = 1 1 + e w \cdot x + b

$\begin{aligned}P(Y=1|x)&=\cfrac{1}{1+e^{-w\cdot x+b}}=\cfrac{e^{w\cdot x+b}}{1+e^{w\cdot x+b}} \\ P(Y=0|x)&=1-P(Y=1|x)=\cfrac{1}{1+e^{w\cdot x+b}}\end{aligned}$
令

w=(w;b) w = ( w ; b ) $w=(w;b)$ ，此时，观察：

l o g P ( Y = 1 | x ) P ( Y = 0 | x ) = w \cdot x

$log \cfrac{P(Y=1|x)}{P(Y=0|x)}=w\cdot x$
即求对数之后是线性的，因此逻辑回归是对数线性模型。
逻辑回归是分类任务，图如下：
这里写图片描述

sigmoid函数

sigmoid函数公式如下：

f (x) = 1 1 + e - x

$f(x)=\frac{1}{1+e^{-x}}$
图像如下所示：
这里写图片描述

sigmoid函数有一个很好的特性，即：

f' (x) = f (x) (1 - f (x))

$f\prime (x)=f(x)(1-f(x))$

极大似然估计

似然函数为：

L (w) = \prod i = 1 n P (Y = 1 | x i) y i P (Y = 0 | x i) 1 - y i

$L(w)=\prod_{i=1}^{n}P(Y=1|x_i)^{y_i}P(Y=0|x_i)^{1-y_i}$
对其求对数，得对数似然函数：

log L (w) = \sum i = 1 n [y i log e w \cdot x i 1 + e w \cdot x i + (1 - y i) log 1 1 + e w \cdot x i] = \sum i = 1 n [y i (w \cdot x i) - log (1 + e w \cdot x i)]

$\log L(w)=\sum_{i=1}^{n}[y_i\log\cfrac{e^{w\cdot x_i}}{1+e^{w\cdot x_i}}+(1-y_i)\log \cfrac{1}{1+e^{w\cdot x_i}}] \\ =\sum_{i=1}^{n}[y_i(w\cdot x_i)-\log(1+e^{w\cdot x_i})]$
最大化对数似然函数，即可求出参数w的估计值。

损失函数

损失函数为负的对数似然函数：

L (w)^= - 1 n log L (w) = - 1 n \sum i = 1 n [y i (w \cdot x i) - log (1 + e w \cdot x i)]

$\hat{L(w)}=-\frac1n\log L(w)=-\frac1n\sum_{i=1}^{n}[y_i(w\cdot x_i)-\log(1+e^{w\cdot x_i})]$
将

L(w)^ L ( w ) ^ $\hat{L(w)}$ 记为

L(w) L ( w ) $L(w)$ ，即

L (w) = - 1 n \sum i = 1 n [y i (w \cdot x i) - log (1 + e w \cdot x i)]

$L(w)=-\frac1n\sum_{i=1}^{n}[y_i(w\cdot x_i)-\log(1+e^{w\cdot x_i})]$
因此，极大化对数似然函数，即极小化损失函数。可用梯度下降法、拟牛顿法等优化方法来进行参数估计。

梯度下降

梯度下降法是一种迭代性的优化算法，先随机选取初始点 $w_0$ ，然后用下面的公式更新参数w，直到满足终止条件为止。

w = w - α \partial L ( w ) w

$w = w-\alpha \cfrac{\partial L(w)}{w}$
其中，

α α $\alpha$ 为学习率，

\partial L ( w ) w = - 1 n \sum i = 1 n (y i - e w \cdot x 1 + e w \cdot x) x i

$\cfrac{\partial L(w)}{w}=-\frac 1n\sum_{i=1}^{n}\left(y_i-\cfrac{e^{w\cdot x}}{1+e^{w\cdot x}} \right)x_i$
梯度下降过程如下：
这里写图片描述

参考资料

李航，《统计学习方法》
赵志勇，《Python机器学习算法》
周志华，《机器学习》
Peter，《机器学习实战》
寒小阳，七月在线机器学习工程师
邹博，小象学院机器学习升级版

Cluluxiu

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
找工作之逻辑回归

线性回归模型损失函数最小二乘参数估计多元线性回归逻辑回归模型sigmoid函数损失函数梯度下降参考资料注：本博客定义为学习笔记，为本人通过一些材料和书籍整理而来，或许会有些许心得体会。线性回归模型公式如下： f(x)=wx+b(0)(0)f(x)=wx+bf(x)=wx+b\tag0 给定一组样本(x1,y1)(x2,y1)…...
复制链接

扫一扫

专栏目录