1、评估指标
预测值 | |||
---|---|---|---|
0 | 1 | ||
实际 | 0 | TN | FP |
1 | FN | TP |
- a c c u r a c y = T N + T P T N + T P + F P + F N accuracy = \frac{TN+TP}{TN+TP+FP+FN} accuracy=TN+TP+FP+FNTN+TP
- p r e c i s i o n = T P T P + F P precision= \frac{TP}{TP+FP} precision=TP+FPTP
- r e c a l l = T P T P + F N recall= \frac{TP}{TP+FN} recall=TP+FNTP
- F 1 = 2 ∗ ( p r e + r e c ) p r e + r e c F1= \frac{2*(pre+rec)}{pre+rec} F1=pre+rec2∗(pre+rec)
- ROC曲线: X 轴 : F P R = F P F P + T N ; Y 轴 : T P R = T P T P + F N X轴:FPR=\frac{FP}{FP+TN};Y轴:TPR=\frac{TP}{TP+FN} X轴:FPR=FP+TNFP;Y轴:TPR=TP+FNTP
2、偏差与方差(过拟合与欠拟合)
E r r o r = B i a s + V a r i a n c e Error=Bias+Variance Error=Bias+Variance
- E r r o r Error Error:整个模型的准确度
- B i a s Bias Bias:模型在样本上的输出与真实值之间的误差(即模型本身的精度)
-
V
a
r
i
a
n
c
e
Variance
Variance:每次输出结果与模型输出期望之间的误差(即模型的稳定性)
3、正则化(解决过拟合)
- L1正则化产生稀疏特征
- L2产生更多特征但都会接近于0