一元,简单入门
-
监督学习的一种
-
以预测房价为例,有一组数据集,以房子大小为X轴,以售价为Y轴,画图。
-
回归用来预测一个连续输出值,对应着分类问题,预测一个离散输出值,两者都为监督学习
-
一组数据集,(x,y),x为输入值,经过假设函数h,得到值预测值y。h是y关于x的线性函数,这种模型称为线性回归(liner regression)or单变量线性回归。
-
h(x)=ax+b,a与b称为模型参数,parameters,学会如何选择参数,选择不同的a,b会得到不同的假设函数hypothesis
-
在线性回归中,有一个训练集trainning set,我们要得出a,b的值,得出假设函数,并让该函数h表示的直线尽量地与这些数据点很好的拟合。
-
在线性回归中标准的定义:最小化问题,关于a,b的最小值,使得h(x)与y之间的差异最小。w=(∑(h(x)-y)²)/2m,即我们的任务就是,找到最合适的a,b使得w最小,(道理同平均误差),w这个式子称为线性回归的代价函数cost function,也称为平方误差函数 Squares error function,这是解决线性回归最常用的手段,当然也有其他代价函数。Min(∑(h(x)-y)²)/2m)称为目标函数
-
代价函数是用来干嘛的,以及我们为什么要用它。
代价函数用来衡量