线性回归
在下面的房价预测问题中,我们需要拟合一条直线,根据房屋的大小来预测房价。
这是一个监督学习的问题,因为我们的数据中有标签也就是房价,同样这还是一个回归问题,因为预测变量 y (也就是我们的房价)是连续的实数。
下面我们定义一些常用的符号
m 表示我们训练样本的数量,也就是我们有多少条数据。
x 表示我们的输入变量或者说特征
y 表示我们的输出变量或者说标签
我们使用(x,y)表示一个训练样本,
(
x
(
i
)
,
y
(
i
)
)
(x^{(i)},y^{(i)})
(x(i),y(i))来表示第i个训练样本。
下面是机器学习的一般流程:
我们使用训练集学习我们的机器学习模型,在这里我们需要学习一个线性函数h,这个函数h能通过房屋的大小来计算房屋的价格。
这样我们的线性函数可以写成 h θ ( x ) = θ 0 + θ 1 x h_\theta(x)=\theta_0+\theta_1x hθ(x)=θ0+θ1x,这里的 θ 0 , θ 1 \theta_0,\theta_1 θ0,θ1是我们要学习的参数。这样子的模型被成为线性回归。