问题一:为什么平方损失函数不适用于分类问题,交叉熵损失函数不适用于回归问题。
分类问题多为离散值标签,而且只在意该数据是否属于这一类或不属于这一类,但平方回归损失函数在计算损失时可能会因为一些“异常数据”(远离大部分数据)而导致损失变大,将预测误差增大。再来看回归问题,其真实标签通常是连续的数值,而交叉熵损失函数的计算依赖于类别的离散标签,并通过比较模型输出的概率分布与真实标签来计算损失,无法直接用交叉熵损失函数来计算损失。
问题二:对于一个三分类问题,数据集的真实标签和模型的预测标签如下:
真实标签 | 1 | 1 | 2 | 2 | 2 | 3 | 3 | 3 | 3 |
预测标签 | 1 | 2 | 2 | 2 | 3 | 3 | 3 | 1 | 2 |
分别计算模型的精确率、召回率、F1值以及他们的宏平均和微平均。