1、混淆矩阵
2、常用术语
(1)True Positives,TP:预测为正样本,实际也为正样本的特征数
(2)False Positives,FP:预测为正样本,实际为负样本的特征数(错预测为正样本了,所以叫False)
(3)True Negatives,TN:预测为负样本,实际也为负样本的特征数
(4)False Negatives,FN:预测为负样本,实际为正样本的特征数(错预测为负样本了,所以叫False)
3、评价指标
(1)灵敏度(sensitivity)=召回率(recall):TPR = TP/(TP+FN)
(2)特指度(specificity):TNR = TN/(TN+FP)
(3)精确度(Precision):P = TP/(TP+FP)
(4)错误率(error rate)=(FP+FN)/(P+N)
(5)正确率(accuracy)=(TP+TN)/(P+N)
4、ROC曲线和PR曲线
参考:http://blog.csdn.net/xiahouzuoxin/article/details/43165253
每一条ROC曲线和PR曲线都代表一个分类算法,曲线上每一个点都代表一个确定阈值theta时的评价指标(比如:recall和precision)