线性回归的正规方程推导

最新推荐文章于 2022-09-19 00:08:42 发布

奶糖派大白兔

最新推荐文章于 2022-09-19 00:08:42 发布

阅读量788

点赞数

文章标签：机器学习

本文链接：https://blog.csdn.net/BIG_Ribbit/article/details/111089442

版权

这篇博客详细介绍了线性回归模型的正规方程推导过程，从残差的正态分布开始，通过最大化似然函数求得最优参数θ。讨论了如何找到使代价函数最小化的θ值，并解释了在XTX不可逆时可能出现的问题及其解决方案。

摘要由CSDN通过智能技术生成

线性回归的正规方程推导

除了梯度下降法，我们还可以用正规方程法来求线性回归模型。

1. 正规方程的推导

设样本数量为 $m$ ，每个样本有 $n$ 个特征，线性回归模型 $h_\theta(x)$ 为：
$h_\theta(x) = \theta_0x_0+\theta_1x_1+\theta_2x_2+\cdots+\theta_nx_n=\theta^Tx$
其中每个样本数据的 $x_0$ 恒为1。

第 $i$ 个样本数据特征变量记为 $x^{(i)}$ ，目标变量为 $y^{(i)}$ ， $h_\theta(x^{(i)})$ 为第 $i$ 个样本数据的模型预测值， $\epsilon^{(i)}$ 为观察值和预测值之间的差（残差），则
$\epsilon^{(i)}= h_\theta(x^{(i)})-y^{(i)}=\theta^Tx^{(i)}-y^{(i)}$
$\epsilon^{(i)}$ 一般服从均值为0的正态分布，设这个正态分布的方差为 $\sigma^2$ ，则 $\epsilon$ 的概率密度函数 $f(\epsilon;\theta^T)$ 为
$f(\epsilon;\theta^T)=\frac{1}{\sqrt{2\pi}\sigma}exp(-\frac{\epsilon^2}{2\sigma^2})$
这些残差的似然函数为