Multivariate Linear Regression的参数估计

最新推荐文章于 2024-06-05 10:44:52 发布

阿拉丁吃米粉

最新推荐文章于 2024-06-05 10:44:52 发布

阅读量1.7k

点赞数

文章标签：多元线性回归 regression 梯度下降规范化

本文链接：https://blog.csdn.net/jinping_shi/article/details/51931743

版权

本文详细介绍了多元线性回归的参数估计方法，包括梯度下降法和正规方程。阐述了代价函数的概念及其在梯度下降法中的应用，探讨了规范化在解决过度拟合和稀疏矩阵问题中的作用，并展示了规范化后的梯度下降过程和正规方程。内容涵盖线性回归模型的构建、误差项的正态分布假设以及极大似然估计。

摘要由CSDN通过智能技术生成

多元线性回归的表现形式是 $h_\theta(x)=y=\theta_0 + \theta_1x_1 + \theta_2x_2+...+\theta_nx_n \tag{1}$

其中 $x_1...x_n$ 是 $n$ 个变量， $\theta_0...\theta_n$ 是 $n + 1$ 个参数。 $h$ 是hypothesis的简称。如果定义 $x_0 = 1$ ，(1)式可以变为(2)式：
$h_\theta(x)=y=\theta_0x_0 + \theta_1x_1 + \theta_2x_2+...+\theta_nx_n \tag{2}$
其中 $x_0 = 1$ .

令： $\begin{bmatrix} x_0 \\ x_1 \\ \vdots \\ x_n \end{bmatrix}, \Theta = \begin{bmatrix} \theta_0 \\ \theta_1 \\ \vdots \\ \theta_n \end{bmatrix}$
(2)式可简记为(3)式：
$h_\theta(x) = \Theta^{\rm T}X \tag{3}$

例如下表，我们要根据房屋属性预测房屋价格。那么在该例中，一共有4个属性，分别是Size, Number of bedrooms, Number of floors, Age of home，表示为 $x_1, x_2, x_3, x_4$ . Price是要预测的值，即 $y$ ，这里表示为 $h_\theta(x)$ .

上表中有很多行，每一行称为一个训练样本(training example/sample). 为方便描述，定义以下符号：
$n$ : 属性数量
$m$ : 训练样本数量
$x^{(i)}$ : 第 $i$ 个训练样本的属性
$x^{(i)}_j$ : 第 $i$ 个训练样本的第 $j$ 个属性

从(3)式可知，如果我们知道了参数矩阵 $\Theta^{\rm T}$ 的每一个值，就可以用方程(3)来预测未知样本的值。如何求得 $\Theta^{\rm T}$ ？机器学习中的一个重要任务就是估计 $\Theta^{\rm T}$ . 足够好的 $\Theta^{\rm T}$ 必定会使得预测值无限接近于真实值，如果设计一个关于 $\Theta^{\rm T}$ 的函数用来表示预测值与真实值之间的差异，那么求得一个足够小的差异，就可以解出 $\Theta^{\rm T}$ ，这个函数通常成为代价函数（cost function），简记为 $J(\boldsymbol{\theta})$ .