线性回归的目的是用训练样本拟合出一条曲线(或超平面)。
假设我们有如下关于房屋价格和居住面积的样本数据:
我们可以将它画在二维表中如下:
利用这些数据,我们可以拟合出一条曲线,用以估计其它房屋的价格。
在这里我们用 x(i) 表示“输入”(即居住面积),也称之为特征;用 y(i) 表示“输出”(即房屋中的价格)。对于一对 x(i),y(i) 我们称之为一个训练样本。
我们的目的就是训练出一个类似下面的函数:
hθ(x)=θ0+θ1x
其中我们训练的目的是得到一个合适的
θ
。
基本流程如下: