一、习题2-1
(1)为什么平方损失函数不适用于分类问题 :
首先举个栗子,假如是一个四分类的问题,分为标签分别为“1”,“2”,“3”,“4”.假设真实标签为“1”,如果用平方损失函数的话,预测标签为“2”,“3”,“4”时,得到的平方损失函数的结果是不同的,而正常情况下都是分类错误,其衡量结果应该是相同的。
所以总结一下就是在分类错误时,不同的错误结果可能导致的损失函数不同。
(2)为什么交叉熵损失函数不适合回归问题:
通俗理解什么是交叉熵损失函数:
想象一下,你有一个分类模型,它可以将输入的数据分为不同的类别。你希望这个模型能够准确地识别输入属于哪个类别,以便做出正确的预测。交叉熵损失就是一种衡量模型预测准确性的指标。
具体来说,交叉熵损失通过对比模型给出的概率分布(例如,某个输入属于每个类别的概率)和实际标签的分布(通常采用“独热编码”,将真实标签表示为只有一个元素为1,其他元素都为0的向量),来计算两者之间的差异。
如果模型的预测结果与实际标签非常接近,交叉熵损失将会较低,表示模型的性能良好。如果模型的预测结果与实际标签差距较大,交叉熵损失将会较高,表示模型的性能较差。
为什么交叉熵损失函数不适合回归问题:
交叉熵损失函数是衡量分类模型输出的概率分布与实际标签之间的差异,而在回归问题中,我们关注的是预测值与实际值之间的数值差异。
在分类问题中,输出是一个概率分布,而交叉熵通过计算实际类别的概率与模型输出的概率之间的差异,来衡量模型的预测准确性。而在回归问题中,预测值是一个连续的实数,而不是一个概率分布。回归问题的目标是尽可能准确地预测一个连续的数值,而不是分类问题中的离散类别。
二、习题2-12
(1)、公式回顾
时F的值称为F1值
宏平均:
微平均(由查阅资料得到):
(2)解题过程
把题中的数据可以归纳为:
1 | 1 | 0 | |
0 | 2 | 1 | |
1 | 1 | 2 |
精确率:
召回率:
F1值:
宏平均:
微平均·:
三:总结:
精确率,召回率,F1值针对每个类。
宏平均针对总体。
微平均针对每一个样本。