从这一讲开始将真正的东西了,这一课下来听得云里雾里,似懂非懂。数学知识还是要加强一下,线性代数很多东西都忘光了,先写篇博客巩固一下这节课的内容,抽空再去复习一遍线性代数把。机器学习,任重道远啊~~
问题引入
Andrew Ng老师举的例子是房子关于价格的例子,即给出一组房屋价格与卧室数量,房屋面积的对应关系。如下图:
我们要完成的任务是:给定一个房屋的面积和卧室的数量预测出他的价格。
线性回归
先给出以下变量定义:
我们的解决方案是,根据已知的数据进行拟合。这就是监督学习,所谓的监督就是先前有一组正确数据作为训练,经过这组数据训练之后就可以进行房屋价格的预测了。我们先简化问题,只给出房屋面积与价格的对应的关系,把这组数据绘制到二维坐标系中,便可以看到很多散点。比如像这样:
我们通过这组点可以的到一个形如 y=a+bx 这样的方程。其中 a,b 都是参数,只要给定一个 x 就可以得到一个 y 。由于这个方程是线性的,所以称之为线性回归。当问题进一步复杂的时候(有更多对 y