什么是代价函数
在机器学习中,我们往往希望从已获得的离散数据中拟合出一个尽可能准确的函数(或者说是曲线)
举个例子:已知获得了一个(x,y)数据集,并根据这个数据集在坐标中画出点
我们可以自己定义一个函数h(x)=θ_0+θ_1* x,分别来拟合这个数据.现在分别定义了三个函数,其表现形式分别是图中的这三条线,
那如何确定哪个函数拟合比较准确,有什么判定标准吗?这里我们常用的方法是用把每个y在垂直方向的偏差的平方求和,表示为:
其中我们规定:J 称作代价函数(cost function)
m=样本总数 ,
x = 输入的变量,
y = 数据集中输入为x时对应的输出,
显然,通过这个公式,我们可以计算出三个函数a,b,c各自所对应的J,只需要比对一下各自J值的大小,其中的最小值所对应的函数即为这三个函数