找工作之逻辑回归

最新推荐文章于 2024-07-01 22:01:12 发布

Cluluxiu

最新推荐文章于 2024-07-01 22:01:12 发布

阅读量287

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/Cluluxiu/article/details/80386185

版权

机器学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

注：本博客定义为学习笔记，为本人通过一些材料和书籍整理而来，或许会有些许心得体会。

线性回归

模型

公式如下：

f (x) = w x + b (0)

$f(x)=wx+b\tag0$
给定一组样本

(x1,y1)(x2,y1)…(xi,yi)…(xn,yn) ( x 1 , y 1 ) ( x 2 , y 1 ) … ( x i , y i ) … ( x n , y n ) $(x_1,y_1)(x_2,y_1)\ldots (x_i,y_i)\ldots (x_n,y_n)$ ，若要用一个函数来拟合所有样本点的y值，可以用公式0来进行拟合。图如下（来自百度百科）：
这里写图片描述

损失函数

L (w, b) = \sum i = 1 n (f (x) - y i) 2

$L(w,b)=\sum_{i=1}^{n}(f(x)-y_i)^2$

最小二乘参数估计

令均方误差最小化，即：

(w *, b *) = arg min (w, b) \sum i = 1 n (f (x i) - y i) 2 = arg min (w, b) \sum i = 1 n (w x i + b - y i) 2

$\begin{aligned}(w^*,b^*)&=\mathop{\arg\min}_{(w,b)}\sum_{i=1}^{n}(f(x_i)-y_i)^2 \\ & =\mathop{\arg\min}_{(w,b)}\sum_{i=1}^{n}(wx_i+b-y_i)^2 \end{aligned}$
分别令L(w,b)对w和b进行微分，令微分为0：

\partial L ( w , b ) \partial w = 0 \partial L ( w , b ) \partial b = 0

$\frac{\partial L(w,b)}{\partial w}=0 \\ \frac{\partial L(w,b)}{\partial b}=0$
求出结果如下：

w b = \sum i = 1 n y i ( x i - x ¯ ) \sum i = 1 n x 2 i - 1 n ( \sum i = 1 n x i ) 2 = 1 n \sum i = 1 n (y i - w x i)

$\begin{aligned}w&=\cfrac {\sum\limits_{i=1}^{n}y_i(x_i-\bar x)}{\sum\limits_{i=1}^{n}x_i^2-\cfrac 1n\left(\sum\limits_{i=1}^{n}x_i\right)^2} \\ b&=\frac 1n\sum_{i=1}^{n}(y_i-wx_i)\end{aligned}$

多元线性回归

f (x i) = w T x + b

$f(x_i)=w^Tx+b$

xi=(xi1;xi2;…;xid) x i = ( x i 1 ; x i 2 ; … ; x i d ) $x_i=(x_{i1};x_{i2};\ldots;x_{id})$
令

w=(w;b) w = ( w ; b ) $w=(w;b)$
同样应用最小二乘法进行参数估计，得

w * = arg min w (y - x w) T (y - x w)

$w^*=\mathop{\arg\min}_w(y-xw)^T(y-xw)$
令

L(w)=(y−xw)T(y−xw) L ( w ) = ( y − x w ) T ( y − x w ) $L(w)=(y-xw)^T(y-xw)$ ，对L(w)求导为0，得：

\partial L ( w ) \partial w = 2 x T (y - x w) = 0

$\frac{\partial L(w)}{\partial w}=2x^T(y-xw)=0$

逻辑回归

模型

P (Y = 1 | x) P (Y = 0 | x) = 1 1 + e - w \cdot x + b = e w \cdot x + b 1 + e w \cdot x + b = 1 - P (Y = 1 | x) = 1 1 + e w \cdot x + b

$\begin{aligned}P(Y=1|x)&=\cfrac{1}{1+e^{-w\cdot x+b}}=\cfrac{e^{w\cdot x+b}}{1+e^{w\cdot x+b}} \\ P(Y=0|x)&=1-P(Y=1|x)=\cfrac{1}{1+e^{w\cdot x+b}}\end{aligned}$
令

w=(w;b) w = ( w ; b ) $w=(w;b)$ ，此时，观察：

l o g P ( Y = 1 | x ) P ( Y = 0 | x ) = w \cdot x

$log \cfrac{P(Y=1|x)}{P(Y=0|x)}=w\cdot x$
即求对数之后是线性的，因此逻辑回归是对数线性模型。
逻辑回归是分类任务，图如下：
这里写图片描述

sigmoid函数

sigmoid函数公式如下：

f (x) = 1 1 + e - x

$f(x)=\frac{1}{1+e^{-x}}$
图像如下所示：
这里写图片描述

sigmoid函数有一个很好的特性，即：

f' (x) = f (x) (1 - f (x))

$f\prime (x)=f(x)(1-f(x))$

极大似然估计

似然函数为：

L (w) = \prod i = 1 n P (Y = 1 | x i) y i P (Y = 0 | x i) 1 - y i

$L(w)=\prod_{i=1}^{n}P(Y=1|x_i)^{y_i}P(Y=0|x_i)^{1-y_i}$
对其求对数，得对数似然函数：

log L (w) = \sum i = 1 n [y i log e w \cdot x i 1 + e w \cdot x i + (1 - y i) log 1 1 + e w \cdot x i] = \sum i = 1 n [y i (w \cdot x i) - log (1 + e w \cdot x i)]

$\log L(w)=\sum_{i=1}^{n}[y_i\log\cfrac{e^{w\cdot x_i}}{1+e^{w\cdot x_i}}+(1-y_i)\log \cfrac{1}{1+e^{w\cdot x_i}}] \\ =\sum_{i=1}^{n}[y_i(w\cdot x_i)-\log(1+e^{w\cdot x_i})]$
最大化对数似然函数，即可求出参数w的估计值。