L1 平均绝对误差MAE L2 均方误差MSE 交叉熵CE 用于度量两个概率分布之间的差异性信息。 对交叉熵求最小值,也等效于求最大似然估计。 在机器学习领域,我们令P(x)为预测集,Q(x)为真实数据集。