文章目录
分类模型的评估
首先给出正例与反例的定义:
- 真正例(True Positive,TP):真实类别为正例,预测类别为正例。
- 假正例(False Positive,FP):真实类别为负例,预测类别为正例。
- 假负例(False Negative,FN):真实类别为正例,预测类别为负例。
- 真负例(True Negative,TN):真实类别为负例,预测类别为负例。
「准确率(Accuracy)」
定义:对于给定的测试数据集,分类器正确分类的样本数与总样本数之比。
A c c u r a c y = T P + T N T P + F P + F N + T N Accuracy = \frac{TP+TN}{TP+FP+FN+TN} Accuracy=TP+FP+FN+TNTP+TN
「精确率(Precision)」
又称为查准率(Precision, P),
P = T P T P + F P P =\frac{TP}{TP+FP} P=TP+FPTP
「召回率(Recall)」
又称为查全率(Recall, R),
R = T P T P + F N R = \frac{TP}{TP+FN} R=TP+FNTP
「ROC」
Receiver Operating Characteristic (ROC) Curve
「F1值」
是精确率和召回率的调和均值,
F 1 = 2 T P 2 T P + F P + F N F_1=\frac{2TP}{2TP+FP+FN} F1=2TP+FP+FN2TP
「G-Mean指标」
用以评价不平衡数据的模型表现,
G m e a n = T P T P + F N × T N T N + F P Gmean = \sqrt{\frac{TP}{TP+FN}\times \frac{TN}{TN+FP}} Gmean=TP+FNTP×TN+FPTN
衡量线性回归法的指标
对于回归模型,常用的指标有MSE、RMSE、MAE、R2等
「MSE」
Mean Squared Error,均方误差,
1 m ∑ i = 1 m ( y p r e d i c t ( i ) − y t r u e ( i ) ) 2 \frac{1}{m} \sum_{i=1}^m(y_{predict}^{(i)}-{y}_{true}^{(i)})^2 m1i=1∑m(ypredict(i)−ytrue(i))2
「RMSE」
Root Mean Squared Error,均方根误差,
∑ i = 1 m ( y p r e d i c t ( i ) − y t r u e ( i ) ) 2 = M S E \sqrt{\sum_{i=1}^m(y_{predict}^{(i)}-{y}_{true}^{(i)})^2}=\sqrt{MSE} i=1∑m(ypredict