分类模型的效果度量---R语言实现
之前我们介绍了连续型响应变量模型的评估方法(有包括RMSE,R^2之类的评估指标),这次我们介绍一下分类型响应变量模型的评估方法。
目 录
三.接受者操作特征(ROC)曲线
五、R语言实现
一、分类模型介绍
分类模型一般产生两种类型的预测。和回归模型类似,分类模型产生一个连续数值预测,该预测通常是概率的形式(即任意样本从属于不同类别的概率预测值均在0到1之间,合计为1)。
二、混淆矩阵
评估分类模型性能一个常用的方法是混淆矩阵(一张简单的观测类和预测类的交叉表)。如表1.1所示:
表1.1 二分类问题的混淆矩阵
Table 1.1 The confusion matrix of binaryclassification problem
预测 |
观测 |
|
发生 |
不发生 |
|
发生 |
TP |
FP |
不发生 |
FN |
TN |
注:表格单元分别代表真阳性(TP),假阳性(FP),假阴性(FN),真阴性(TN)的数量。
模型的准确度稳定在一个水平,通常会在灵敏度和特异度之间做一个权衡。一般而言,增加灵敏度会使特异度下降。能同时反应假阳性率和假阴性率的指标有Youden指数