一、学习知识点概要
了解数据概况,学习金融风控中常见的分类算法评估指标和预测类评估指标。
二、学习内容
1、不同数据列的性质特征
2、分类算法的常见评估指标
①混淆矩阵
- 如果一个样本是正样本,并且预测结果也是正样本,则就是真正类TP
- 如果一个样本是正样本,但是预测结果是负样本,即为假负类FN
- 如果一个样本是负样本,但是预测结果是正样本,即为假正类FP
- 如果一个样本是负样本,并且预测结果也是负样本,即为真负类TN
②准确率(衡量预测准确数在总预测数中占比的指标,但是不适合样本不均衡的情况)
③精确率 (又称查准率,真正类(TP)占预测为正样本(TP+FP)的百分比)
④召回率(又称查全率,真正类(TP)占正样本(TP+FN)的百分比)