最大似然用于线性回归的公式推导

最新推荐文章于 2023-12-20 19:51:19 发布

帮主写书

最新推荐文章于 2023-12-20 19:51:19 发布

阅读量1.1k

点赞数

文章标签：最大释然最小均方误差

本文链接：https://blog.csdn.net/woods_ctbu/article/details/82761051

版权

高斯分布定义

假设随机变量X服从高斯分布，记作 $X\sim N(\mu, \sigma^2)$ 。概率密度函数为：
$\frac {1} {\sqrt{2\pi \sigma^2}}e^{- \frac{(x-\mu)^2}{2\sigma^2}}$

用最大释然推导得到线性回归均方误差

为了得到之前推导出的相同的线性回归算法，定义 $p(y|x)=N(y;y^{\bullet}(x;w),\sigma^2)$ 。函数 $y^{\bullet}(x;w)$ 预测高斯的均值。
$\theta_{ML} = arg max_{\theta} \sum_{i=1}^{m}logp(y^{(i)}|x^{(i)};\theta)$
上式中：
$\sum_{i=1}^{m} logp(y^{(i)}|x^{(i)};\theta) = \sum_{i=1}^{m} log\frac {1} {\sqrt{2\pi \sigma^2}} e^{- \frac{ [y^{(i)}-y^{\bullet(i)}]^2 } {2\sigma^2}}$

$=\sum_{i=1}^{m} log\frac {1} {\sqrt{2\pi \sigma^2}}+ \sum_{i=1}^{m}-\frac{[y^{(i)}-y^{\bullet(i)}]^2 } {2\sigma^2 }$

$=-\sum_{i=1}^{m} log\sqrt{2\pi\sigma^2} -\sum_{i=1}^{m} \frac{||y^{(i)}-y^{\bullet(i)}||^2} {2\pi\sigma^2}$

$=-mlog\sigma-\frac{m}{2}log(2\pi)-\sum_{i=1}^{m} \frac{||y^{(i)}-y^{\bullet(i)}||^2} {2\pi\sigma^2}$

由上式可知最大化 $\sum_{i=1}^{m}logp(y^{(i)}|x^{(i)};\theta)$ 等价于最小化 $\sum_{i=1}^{m} \frac{||y^{(i)}-y^{\bullet(i)}||^2}{2\pi\sigma^2}$ 。而
$MSE_{train} = \sum_{i=1}^{m} \frac{||y^{(i)}-y^{\bullet(i)}||^2}{2\pi\sigma^2}$
由此便由最大似然推出了线性回归的最小均方误差。