NNDL 作业二

最新推荐文章于 2024-07-25 12:58:40 发布

CikL160

最新推荐文章于 2024-07-25 12:58:40 发布

阅读量114

点赞数 2

分类专栏：作业文章标签：深度学习

本文链接：https://blog.csdn.net/weixin_63316615/article/details/133236214

版权

13 篇文章 0 订阅

订阅专栏

问题一、分析为什么平方损失函数不适用于分类问题，交叉熵损失函数不适用于回归问题。

平方损失函数：

$E(f;D)=\frac{1}{m}\sum_{i=1}^{m}(f(\mathbf{x_i})-y_i)^{2}$

平方损失函数可反映出模型的输出与实际结果之间的距离。对于分类问题，输出结果就是类别，每个标签之间的距离没有实际意义，计算结果也不能反映分类问题的最优化程度。

交叉熵函数主要用于衡量两个概率分布之间的差异程度。能够表示真是概率分布与预测分布概率之间的差异。公式为：

$H(p,q)=-\sum_{x}^{}p(x)log(q(x))$

交叉熵损失函数对分类正确的结果更关注。平方损失函数如果用于分类任务，会导致正确分类和错误分类变得平均。但是显然，对于分类问题，错误分类结果并不重要。而对于回归问题就很有必要了。回归问题可以基于均方误差求得最优解。所以说，平均损失函数更适用于回归问题，交叉熵损失函数多适用于分类问题。

问题二、对于一个三分类问题，数据集的真实标签和模型的预测标签如下：

真实标签	1	1	2	2	2	3	3	3	3
预测标签	1	2	2	2	3	3	3	1	2

分别计算模型的精准率、召回率、F1值以及它们的宏平均和微平均。

分类结果的混淆矩阵：

精准率：预测类别为c中，预测正确的比例。

$P=\tfrac{TP_c}{TP_c+FP_c}$

$P1=\frac{1}{2} ,P2=\frac{2}{4}=\frac{1}{2} ,P3=\frac{2}{3}$

召回率：真实标签为c的样本中，预测结果也是c的占比。

$R_c=\tfrac{TP_c}{TP_c+FN_c}$

$R1=\frac{1}{2},R2=\frac{2}{3},R3=\frac{2}{4}=\frac{1}{2}$

F1值：

$F1=\tfrac{2*P*R}{P+R}$

$F1_1=\frac{1}{2},F2_2=\frac{4}{7},F3_3=\frac{4}{7}$

宏平均：

$macro-P=\tfrac{1}{n}\sum_{i=1}^{n}P_i$ =5/9

$macro-R=\tfrac{1}{n}\sum_{i=1}^{n}R_i$ =5/9

$maco-F1=\frac{2*maco-P*maco-R}{maco-P+maco-R}$ =5/9

微平均：是每个样本的性能指标的算术平均值。

$micro-P=\tfrac{\bar{TP}}{\bar{TP}+\bar{FP}}=(1+2+2)/((1+2+2)+(1+2+1))=5/9$

$micro-R=\tfrac{\bar{TP}}{\bar{TP}+\bar{FN}}=5/9$

$micro-F1=\tfrac{2*micro-P*micro-R}{micro-P+micro-R}=5/9$

关注