1、为什么损失函数要使用均方误差?
首先将真实值与预测值之间的误差记为,我们知道线性回归的误差项需要满足四个条件:
- 误差项服从正态分布;
- 误差项之间相互独立;
- 误差项均值为0;
- 误差项的方差为常数;
假设误差项服从标准正态分布,则概率密度函数为:
假设m个样本之间相互独立,则给定所有x输出所有真实值y的概率即似然
取对数似然,
又因为标准正态分布的均值为0、方差为1,则
所以,最大化logL相当于最小化
即误差项在服从高斯分布的假设下,最小化均方差损失函数与极大似然估计本质上是一致的。
这么可爱的你,就关注我一下吧~