“损失函数”是如何设计出来的?直观理解“最小二乘法”和“极大似然估计法” 两个概率模型是怎么比较的最小二乘法极大似然估计交叉熵 两个概率模型是怎么比较的 最小二乘法 极大似然估计 交叉熵 链接: 交叉熵.