公众号"大数据建模的一点一滴"于今日正式开通了!开篇分享R语言实现模型评估指标KS曲线。
将代码封装在函数PlotKS_N里,Pred_Var是预测结果,可以是评分或概率形式;labels_Var是好坏标签,取值为1或0,1代表坏客户,0代表好客户;descending用于控制数据按违约概率降序排列,如果Pred_Var是评分,则descending=0,如果Pred_Var是概率形式,则descending=1;N表示在将数据按风险降序排列后,等分N份后计算KS值。
PlotKS_N函数返回的结果为一列表,列表中的元素依次为KS最大值、KS取最大值的人数百分位置、KS曲线对象、KS数据框。
代码如下:
##############code##############
PlotKS_N
# Pred_Var is prop: descending=1
# Pred_Var is score: descending=0
library(dplyr)
df
if (descending==1){
df1
}else if (descending==0){
df1
}
df1$good1
df1$bad