背景:互联网金融虽然给投资者提供了新的理财形式,但跑路经营不善等问题同样会带来风险。以小贷的问题平台和正常平台来阐述运用二分类逻辑回归算法的评价标准描述。
常见的评价指标:混淆矩阵、Accuray、Precision、Recall、Roc、Sensitive、Error Rate
1.混淆矩阵也成误差矩阵,以N行N列的形式表示。
| 预测类 | |||
| 类1(问题平台) | 类2(正常平台) | 总计 | |
实际类
| 类1(问题平台) | 180(TP) | 20(FN) | P |
类2(正常平台) | 140(FP) | 640(TN) | N | |
总计 | P’(被分为类别1) | N’(被分为类别2) | P+N |
第一行之和是200,代表类别1数量是200个。并且,类别1有180个分类正确,类别1有20个错误分类为类别2。
第二行之和是800,代表类别2数量是800个。并且,类别2有640个分类正确,类别2有140个错误分类为类别2。
总的样本数为200+800=1000个
2.正确率(Accuray):正确分类的问题平台与正常平台之和比总样本数。
Accuray = (TP+TN)/(P+N)
3.精度(Precision):表示被分类为问题平台的实际问题平台的比例。
Precision =TP/(TP+FP)
4.召回率(Recall)和灵敏度(Sensitive):表示问题平台被分类为问题平台的比例。
Recall = TP/(TP+FN)
5.特效度(Specificity):正常平台被分类正确的比例。
Specificity = TN/N
6.错误率(Error Rate):分类错误的比例
Error Rate = 1 - Accuray