问题引入
已知南京地区的一组数据:
面积 | 房间数 | 价格 |
---|---|---|
2104 | 3 | 400 |
1600 | 3 | 330 |
2400 | 3 | 369 |
1416 | 2 | 232 |
现在来了一个新的房子,知道其面积和房间数,其价格应该是多少合适呢?
我们可以将面积和房间数看成是房子的两个特征,如何根据这些特征预测价格,需要建立其价格与特征之间的联系。我们设定价格与这些特征之间呈一个近似线性的关系,那么我们就需要找出一个线性函数h:
hθ(x)=θ0+θ1x1+θ2x2
令 x0=1 ,那么上述公式就转化为
h(x)=∑i=0mθTx
现在,给出一组训练数据,如何找出最合适的 θ 呢?最合适的 θ 意味着根据 θ 计算出来的 h(x) 与y最接近。于是我们定义误差函数:
J(θ)=12∑