1单变量线性回归(Linear Regression with One Variable)
1.1 假设方程(Hypothesis)
线性回归属于监督学习,大致是根据给定的数据集训练出一个线性模型,构造成功后,输入一个新的数据后,会输出一个确却的值。比如预测一个地区的房价,给定一个数据集包含房子的大小和房价,当需要预测一个房子的价格时,模型就会预测出一个确却的值。回归一词指的是,我们根据之前的数据预测出一个准确的输出值,对于这个例子就是价格,同时,还有另一种最常见的监督学习方式,叫做分类问题,当我们想要预测离散的输出值,例如,我们正在寻找癌症肿瘤,并想要确定肿瘤是良性的还是恶性的,这就是 0/1 离散输出的问题。线性回归的假设方程为
和
都是具体的值,后面一系列工作就是求出
和
这两个合适的值
1.2 代价函数(Cost Function)
代价函数也被称作平方误差函数,有时也被称为平方误差代价函数。我们之所以要求出误差的平方和,是因为误差平方代价函数,对于大多数问题,特别是回归问题,都是一个合理的选择。代价函数依个人理解为一个标准,即评判我们选择的具体的线性方程的误差大小。由于上述假设方程我们所未知的是 和
,因此要选择合适的
和
使得代价函数最小,定义如下
既然目的为寻找合适的 和
使得代价函数最小,那么就要有一种算法来选择