NNDL 作业1：第二章课后题

最新推荐文章于 2022-10-31 20:44:33 发布

Persevere~~~

最新推荐文章于 2022-10-31 20:44:33 发布

阅读量137

点赞数 1

文章标签：机器学习深度学习人工智能

本文链接：https://blog.csdn.net/m0_73478739/article/details/126919776

版权

习题 2-1 分析为什么平方损失函数不适用于分类问题 , 交叉熵损失函数不适用于回归问题.

1、平方损失函数

平方损失函数为直接测量机器学习模型的输出与实际结果之间的距离。如果定义机器学习模型的输出为 $y_{i}$ ，实际的结果为 $t_{i}$ ，那么平方损失函数可以被定义为：

$L(x)=\frac{1}{N}\sum_{i=1}^{N}(y_{i}-t_{i})^{2}$

不适用于分类问题的原因：

分类问题的结果为离散值，分类问题的标签也不是连续的，每个标签之间的距离也没有实际意义，所以预测值和标签两个向量之间的平方差不能反映分类问题的优化程度。分类问题我们一般采取交叉熵损失函数来进行评估。

2、交叉熵损失函数

交叉熵（Cross Entry）是用来评估当前训练得到的概率分布与真实分布的差异情况，也就是交叉熵的值越小，两个概率分布就越接近。减少交叉熵损失就是在提高模型的预测准确率。其离散函数形式

$H(p,q)=-\sum_{x}^{}p(x)log(q(x))$

参数解释： $p(x)$ 是真实分布的概率， $q(x)$ 是模型通过数据计算出来的概率估计。

不适用于回归问题的原因：

平方损失函数对每一个输出结果都十分看重，而交叉熵损失函数只对正确分类的结果看重。交叉熵损失函数只和分类正确的预测结果有关。而平方损失函数还和错误的分类有关，该损失函数除了让正确分类尽量变大，还会让错误分类都变得更加平均，但实际中后面的这个调整使没必要的。但是对于回归问题这样的考虑就显得重要了，因而回归问题上使用交叉熵并不适合。

参考：平方损失函数与交叉熵损失函数_m_buddy的博客-CSDN博客_平方损失函数
习题 2-12 对于一个三分类问题，数据集的真实标签和模型的预测标签如下：