机器学习：概率视角的线性回归（Linear Regression）

HanZee

已于 2022-09-25 13:00:46 修改

阅读量961

点赞数 1

分类专栏：机器学习

于 2022-03-06 19:59:03 首次发布

本文链接：https://blog.csdn.net/qq_18555105/article/details/123314967

版权

线性回归概率视角极大似然估计噪声最小二乘

关键词由CSDN通过智能技术生成

机器学习专栏收录该内容

27 篇文章 4 订阅

订阅专栏

机器学习：概率视角的Linear Regression

前言
推导过程
结论归纳

前言

上一节我们说到了一元线性回归·与·多元线性回归，大家如果还不清楚，可以去考古。
之前，我们用最小二乘估计，推导出来：
$W^*=argmin(L(W))$
$W^*=(X^T*X^{-1})*X^T*Y$
在这一小节中，我采取概率的视角来解决线性回归问题。

推导过程

在这里插入图片描述
还是这一张图，我们可以发现，如果让拟合的直线与每个观测值x的距离都为0，也就是误差为0，但是这情况是不会出现的，因为数据本身就具有不确定性，带有一定的噪声。如果真有这种情况，这个模型也没有任何意义，只能解决特定问题。
1.我们假设噪声服从正态分布 $\epsilon$ ~N(0, $\sigma^2$ )

2.设 $f(W) = W^TX$ ，我们给函数引入噪声， $\epsilon$ ,其中 $\epsilon$ ~N(0, $\sigma^2$ )

3.那么 $y (∣ X, W)$ ~N( $W^TX$ , $\sigma^2$ )

4.我们把y的均值与方差带入正态方程概率密度函数，得到下面pdf，
$\frac {1} {\sqrt{2\pi}\sigma}exp(-\frac{(y-W^TX)^2}{2 \sigma^2})$

5 接着我们利用MLE（极大似然估计），通过已有的数据推出最有可能的概率模型，得出最优参数W。

6.设log-似然函数:
$\ln\prod_{i=1}^np(y_i|x_i,W)$
$L(W)=\sum_{i=1}^n\ln p(y_i|x_i,W)$
$L(W)=\sum_{i=1}^n\ln \frac {1} {\sqrt{2\pi}\sigma}exp(-\frac{(y_i-W^Tx_i)^2}{2 \sigma^2})$
$L(W)=\sum_{i=1}^n\ln \frac {1} {\sqrt{2\pi}\sigma}-(\frac{(y_i-W^Tx_i)^2}{2 \sigma^2})$
$W^* =argmaxL(W)$
$W^* =argmax\sum_{i=1}^n\ln \frac {1} {\sqrt{2\pi}\sigma}-(\frac{(y_i-W^Tx_i)^2}{2 \sigma^2})$
$W^* =argmax\sum_{i=1}^n-(\frac{(y_i-W^Tx_i)^2}{2 \sigma^2})$
$W^* =argmax\sum_{i=1}^n(y_i-W^Tx_i)^2$

结论归纳

求到最后，我们可以看出，这与之前讲过的最小二乘估计的Cost function是一致的，可以得出结论最小二乘估计隐含了噪声服从正态的假设，从概率角度的MLE（极大似然估计）与MSE（最小二乘估计）本质是一样的。

HanZee

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
机器学习：概率视角的线性回归（Linear Regression）

机器学习：概率视角的Linear Regression前言推导过程结论归纳前言上一节我们说到了一元线性回归·与·多元线性回归，大家如果还不清楚，可以去考古。之前，我们用最小二乘估计，推导出来：W∗=argmin(L(W))W^*=argmin(L(W))W∗=argmin(L(W))W∗=(XT∗X−1)∗XT∗YW^*=(X^T*X^{-1})*X^T*YW∗=(XT∗X−1)∗XT∗Y在这一小节中，我采取概率的视角来解决线性回归问题。推导过程还是这一张图，我们可以发现，如果让拟合的直线
复制链接

扫一扫