点Ta
2 Linear Regression with One Variable(单变量线性回归)
2.1 Case: Housing Prices
使用数据集预测住房价格,数据集包含某市的不同房屋尺寸所售出的价格。
其中,ℎ 代表学习算法的解决方案或函数也称为假设(hypothesis)。
这就是一个监督学习算法的工作方式,在学习算法下,输入训练集里的房屋价格,然后输出一个函数,通常表示为小写 ℎ表示。ℎ 代表 hypothesis(假设),ℎ表示一个函数,输入是房屋尺寸大小,因此 ℎ 根据输入的 𝑥值来得出 𝑦 值,𝑦 值对应房子的价格。因此,ℎ 是一个从𝑥到 𝑦 的函数映射。
那么,对于房价预测问题,该如何表达 ℎ?
一种可能的表达方式为:ℎ𝜃(𝑥) = 𝜃0 + 𝜃1𝑥,因为只含有一个特征/输入变量,因此这样的问题叫作单变量线性回归问题(Linear Regression with One Variable)。
2.2 Cost Function(代价函数)
在线性回归中有一个训练集,其预测的函数形式是:ℎ𝜃(𝑥) = 𝜃0 + 𝜃1𝑥。接下来要做的便是为模型选择合适的参数(parameters)𝜃0 和 𝜃1,在房价问题这个例子中便是直线的斜率和在𝑦 轴上的截距。
选择的参数决定了所得到的直线相对于我们的训练集的准确程度,模型所预测的值与训练集中实际值之间的差距(下图中蓝线所指)就是建模误差(modeling error)。</