nndl第一次作业(P52 2-1,2-12)
一、分析为什么平方损失函数不适用于分类问题?
答:
- 1.平方损失函数通过计算预测值和真实值的偏差程度来计算误差,并且通过在高斯分布的数据上进行极大似然估计,先然适合回归问题;分类问题的分布一般来说并不适合平方损失计算;
- 2.分类问题的数据并非连续的关系,通过计算平方得到的误差大小实际上并不能反映偏差大小,因此损失大小反映的偏差程度难以确定;
- 3.分类问题的函数并不是凸函数,会导致陷入局部最小点,难以优化。
二、对于一个三分类问题,数据集的真实标签和模型的预测标签如下:
真实标签 | 1 | 1 | 2 | 2 | 2 | 3 | 3 | 3 | 3 |
---|---|---|---|---|---|---|---|---|---|
预测标签 | 1 | 2 | 2 | 2 | 3 | 3 | 3 | 1 | 2 |
分别计算模型的精确率、召回率、F1值以及它们的宏平均和微平均。
解:设TP为真正例,TN为真负例,FP为假正例,FN为假负例。
P
r
e
c
i
s
i
o
n
Precision
Precision为精确率,
R
e
c
a
l
l
Recall
Recall为召回率,
F
1
F1
F1为F1值。
-
1.以类别1为正例,其他为负例,可得:
T P = 1 , T N = 6 , F P = 1 , F N = 1 , P r e c i s i o n 1 = 1 1 + 1 = 1 2 , R e c a l l 1 = 1 1 + 1 = 1 2 , F 1 1 = 2 ∗ 1 2 ∗ 1 2 1 2 + 1 2 = 1 2 TP = 1,TN=6,FP=1,FN=1, \\ Precision_1 = \frac{1}{1+1} = \frac{1}{2},\\ Recall_1=\frac{1}{1+1} = \frac{1}{2},\\ F1_1=\frac{2 * \frac{1}{2} * \frac{1}{2}}{\frac{1}{2} + \frac{1}{2}}=\frac{1}{2} TP=1,TN=6,FP=1,FN=1,Precision1=1+11=21,Recall1=1+11=21,F11=21+212∗21∗21=21 -
2.以类别2为正例,其他为负例,可得
T P = 2 , T N = 4 , F P = 2 , F N = 1 , P r e c i s i o n 2 = 2 2 + 2 = 1 2 R e c a l l 2 = 2 2 + 1 = 2 3 , F 1 1 = 2 ∗ 1 2 ∗ 2 3 1 2 + 2 3 = 4 7 TP=2,TN=4,FP=2,FN=1,\\ Precision_2 = \frac{2}{2+2} =\frac{1}{2} \\ Recall_2 = \frac{2}{2+1} =\frac{2}{3},\\ F1_1=\frac{2 * \frac{1}{2} * \frac{2}{3}}{\frac{1}{2} + \frac{2}{3}}=\frac{4}{7} TP=2,TN=4,FP=2,FN=1,Precision2=2+22=21Recall2=2+12=32,F11=21+322∗21∗32=74 -
3.以类别3为正例,其他为负例,可得
T P = 2 , T N = 4 , F P = 1 , F N = 2 , P r e c i s i o n 3 = 2 2 + 1 = 2 3 , R e c a l l 3 = 2 2 + 2 = 1 2 , F 1 1 = 2 ∗ 2 3 ∗ 1 2 2 3 + 1 2 = 4 7 TP=2,TN=4,FP=1,FN=2,\\ Precision_3=\frac{2}{2+1}=\frac{2}{3},\\ Recall_3=\frac{2}{2+2}=\frac{1}{2},\\ F1_1=\frac{2 * \frac{2}{3} * \frac{1}{2}}{\frac{2}{3} + \frac{1}{2}}=\frac{4}{7} TP=2,TN=4,FP=1,FN=2,Precision3=2+12=32,Recall3=2+22=21,F11=32+212∗32∗21=74 -
综合上述三种情况可得宏平均:
M a c r o P = 1 3 ∑ P r e c i s i o n i = 5 9 , M a c r o R = 1 3 ∑ R e c a l l i = 5 9 , M a c r o F 1 = 2 ∗ M a c r o P ∗ M a c r o R M a c r o P + M a c r o R = 5 9 Macro_P=\frac{1}{3} \sum Precision_i = \frac{5}{9},\\ Macro_R=\frac{1}{3} \sum Recall_i = \frac{5}{9},\\ Macro_{F1}=\frac{2*Macro_P*Macro_R}{Macro_P+Macro_R}=\frac{5}{9} MacroP=31∑Precisioni=95,MacroR=31∑Recalli=95,MacroF1=MacroP+MacroR2∗MacroP∗MacroR=95
微平均:
M i c r o P = ∑ T P ∑ T P + ∑ F P = 5 9 , M i c r o R = ∑ T P ∑ T P + ∑ F N = 5 9 , M i c r o F 1 = 2 ∗ M i c r o P ∗ M i c r o R M i c r o P + M i c r o R = 5 9 Micro_P=\frac{\sum TP}{\sum TP + \sum FP} = \frac{5}{9},\\ Micro_R=\frac{\sum TP}{\sum TP + \sum FN} = \frac{5}{9},\\ Micro_{F1}=\frac{2*Micro_P*Micro_R}{Micro_P+Micro_R}=\frac{5}{9} MicroP=∑TP+∑FP∑TP=95,MicroR=∑TP+∑FN∑TP=95,MicroF1=MicroP+MicroR2∗MicroP∗MicroR=95
综上。