写在前面
因为看的是英文版所以不能准确翻译的请见谅。
先说记号,指输入features,指输出或目标值target,一对(, )是一个训练样本training example,训练集training set则是这样的i对样本组成的集合。
对于一个监督学习算法,他的目的是通过一个训练集学到一个方程,输入一个x得到一个比较接近真实的y的预测prediction,这个方程 h 被成为一个猜测hypothesis,这个过程图示为:
当我们要预测的是连续数值,就称这个问题为线性回归linear regression,当预测结果是离散的,就是分类问题classification了。
Part1:线性回归Linear regression
对于一个线性回归的预测我们有如下形式:
在这里是参数parameter(亦可称作权制weight),为方便以后都用h(x)来表示,同时为了简化这一表示方法,增加x0=1这一项之后可以化为: