![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
评分卡
t156xxxx4671
你的小宝贝上线了
展开
-
ROC、K-S,教你巧妙使用模型评价指标
无论是利用模型对信用申请人进行违约识别,还是对授信申请人进行逾期识别……在各种各样的统计建模中,永远必不可少的一步是对模型的评价,这样我们就可以根据模型评价指标的取值高低,来决定选取哪个模型。 最近在某国内商业银行的授信项目中,我们尝试了决策树、logistic等模型来探寻逾期客户的特征。有一天一位专攻系统的小伙伴忽然问我,ROC曲线和K-S曲线的区别和联系是什么?我当时简单解释了一下,事后却细思转载 2017-07-20 10:30:46 · 1768 阅读 · 0 评论 -
AIC准则
AIC信息准则即Akaike information criterion,是衡量统计模型拟合优良性的一种标准,又由与它为日本统计学家赤池弘次创立和发展的,因此又称赤池信息量准则。它建立在熵的概念基础上,可以权衡所估计模型的复杂度和此模型拟合数据的优良性。 在一般的情况下,AIC可以表示为: AIC=2k-2ln(L),其中:k是参数的数量,L是似然函数。 假设条件是模型的误差服从独立正态分布。转载 2017-09-03 22:47:24 · 5743 阅读 · 0 评论 -
评分卡风险视图和异常值处理(R语言)
1、风险视图# 风险视图library(ggplot2)library(plyr)homedir <- "C:/Users/Administrator/Desktop/rrr1/rrr" #设置路径setwd(homedir)a <- read.csv('C:/Users/Administrator/Desktop/bianliang.csv') #读取大宽表b <- sub("Min.原创 2017-08-31 17:28:20 · 1065 阅读 · 0 评论 -
数据分箱
转载自:http://www.cangfengzhe.com/sjwj/2908.html数据分箱的适用情形数据分箱是下列情形下常用的方法:1.某些数值自变量在测量时存在随机误差,需要对数值进行平滑以消除噪音。2.有些数值自变量有大量不重复的取值,对于使用<、>、=等基本操作符的算法(如决策树)而言,如果能减少这些不重复取值的个数,就能提高算法的速度。3.有些算法只能使用分类自变量,需要把数值变量离转载 2017-09-25 21:51:16 · 6495 阅读 · 1 评论 -
申请评分卡模型的构建(一)——数据清洗
http://blog.csdn.net/csqazwsxedc/article/details/51225156 这个链接大致描述了评分卡的构建过程。原创 2017-07-11 20:09:05 · 1789 阅读 · 0 评论 -
R语言 生成顺序标号,累加,滞后函数
1、按照分组生成顺序编号df<-data.frame(group=c(rep("a",3),rep("b",4),rep("c",2)))df<-transform(df, a=as.integer(group))index<-function(x){return(c(1:length(x)))}df<-transform(df,b=unlist(tapply(a,group,index)))原创 2017-08-25 14:22:59 · 8179 阅读 · 1 评论 -
手把手教你用R语言建立信用评分模型(完结篇)— —打分卡转换
全部代码请访问我的Github: http://github.com/frankhlchi/R-scorecard (点击原文链接即可)打分卡转换我们在上一部分,我们已经基本完成了建模相关的工作,并用混淆矩阵验证了模型的预测能力。接下来的步骤,就是将Logistic模型转换为标准打分卡的形式。 在建立标准评分卡之前,我们需要选取几个评分卡参数:基础分值、 PDO(比率翻倍的分值)和好坏比。 这里,转载 2017-07-26 17:56:22 · 10091 阅读 · 1 评论 -
多重共线性的处理方法(转载)
(一)删除不重要的自变量 自变量之间存在共线性,说明自变量所提供的信息是重叠的,可以删除不重要的自变量减少重复信息。但从模型中删去自变量时应该注意:从实际经济分析确定为相对不重要并从偏相关系数检验证实为共线性原因的那些变量中删除。如果删除不当,会产生模型设定误差,造成参数估计严重有偏的后果。(二)追加样本信息(不过实际操作中,这个方法实现率不高) 多重共线性问题的实质是样本信息的不充分而导致模型转载 2017-07-18 14:22:38 · 1887 阅读 · 0 评论 -
R语言笔记1:t检验和Wilcoxon检验
转自新浪博客,转载地址:http://blog.sina.com.cn/s/blog_427c24ae0102wg7n.html1、t检验数据是高血压患者治疗前后舒张压的变化,这个内容最熟悉不过了吧,虽然采用t检验的方法目前有争议,我们后面再讨论。treat 1为处理组,treat 2是对照组。显然,要比较两组的dd(血压下降值)。# 读入SPSS格式的数据setwd("C:/R/R语言笔记")li转载 2017-09-11 18:24:51 · 28951 阅读 · 0 评论