误差函数理解
定义
损失函数(误差函数)是关于模型输出和样本标签值之差的函数,通过对误差函数求导来调节权重参数。
本质:选取恰当的函数来衡量模型输出分布和样本标签分布之间的接近程度。
注:损失函数的基本要求是用来衡量模型输出分布和样本标签分布之间的接近程度,高级需求是在样本分布不均匀地情况下,精确地描述模型输出分布和样本标签之间的接近程度。
功能
调节权重参数
与BP算法,激活函数的关系
误差函数的选择,不仅与要解决的问题有关,而且也和激活函数有关,然后通过对误差函数求导,利用BP调节模型中的所有参数。
误差函数的特点
- 必须是一个凸函数,然后才能用于找到最小值。
- 必须没一点都可导,可导才能通过BP算法完成对权重参数的调节。
- BP算法的目的,就是求能够使误差函数取得最小值对应的权重参数,因此,误差函数求导以后,极值点对应的权重参数就是最优解,极值点的导数为0,参数不再更新,找到了最优解。这也是梯度下降法寻找最优解的原理。
常见误差函数
均方误差函数
公式
回归问题最常用的损失函数是均方误差MSE,定义如下