从数据获取模型,需要有衡量标准即损失函数。如果知道观测值的概率P(y|x),让概率最大就能求得模型。概率P取负对数后,就是损失函数。概率最大,在这里是第一性原理。 回归问题。观测值为高斯分布时,得到平方差损失MSE。观测值为laplace分布式,得到平均绝对误差损失MAE。分类问题。由多分类的观测概率,可以得到交叉熵损失。