自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

军军的专栏

在数据中寻找诗和远方

  • 博客(4)
  • 资源 (5)
  • 问答 (3)
  • 收藏
  • 关注

原创 WOE信用评分卡--R语言实现

---title: "信用评分模型"author:"junjun"date: "2016年10月3日"output:html_document---  # 一、数据的获取与整合 数据来源:数据来自Kaggle,cs-training.csv是有15万条的样本数据,下图可以看到这份数据的大致情况。下载地址为:https://www.kaggle.com/c/G

2017-03-28 10:44:44 11992

转载 WOE信用评分卡--R语言实例

目录(?)[-]信用卡评分一数据准备二数据处理三变量分析四切分数据集五Logistic回归六WOE转换七评分卡的创建和实施转载自:http://blog.csdn.net/csqazwsxedc/article/details/51225156信用卡评分2016年1月10日一、数据准备1、 问题的准备•            目标:要完成一个

2017-03-28 10:41:34 23239 1

转载 WOE评分卡--IV

目录(?)[-]IV的用途对IV的直观理解IV的计算1WOE2 IV的计算公式3 用实例介绍IV的计算和使用31 实例32 计算WOE和IV33 IV值的比较和变量预测能力的排序关于IV和WOE的进一步思考1 为什么用IV而不是直接用WOE2 IV的极端情况以及处理方式转载自:http://blog.csdn.net/ke

2017-03-28 10:38:13 7167

转载 WOE评分卡--WOE理论

1、评分卡概述最常见的用于信用评分的模型就是logistic回归,这是一种处理二分类因变量的广义线性模型。这种模型的理论基础比较扎实,但是对于不同的问题当然也存在一些特殊的处理方式.由于制作评分卡的某些需要,通常会在建立评分模型时将自变量做离散化处理(等宽切割,等高切割,或者利用决策树来切割),但是模型本身没办法很好地直接接受分类自变量的输入,因此需要对自变量进行再次的处理。比较常规的做法

2017-03-28 10:33:53 26458 4

KDD Cup 1998年竞赛

KDD Cup 1998年竞赛的目标是估计一个直邮的回复量,以便获得最多的捐款。数据集的格式是以逗号作为分隔符,其中学习数据集”cup98lrn.txt”包含了95412条记录,481个字段,验证数据集“cup98val.txt”包含了96367条记录,479个字段。每条记录都包含一个CONTROLN字段,该字段是记录的唯一标识符;有两个目标变量TARGET_B和TARGET_D,TARGET_B是一个二进制变量,表示当一条记录中的TARGET_D变量中有捐款时,该条记录是否对邮件做了回复。学习数据集和验证数据集的数据格式相同,但是在验证数据集中没有包含TARGET_B和TARGET_D这两个变量。

2016-10-04

2016数据挖掘面试总结

2016数据挖掘面试题总结 用户画像的分层 C4.5信息增益率怎么推理,决策树的参数选择

2016-03-08

R语言与数据挖掘最佳实践和经典案例_(澳)

数据挖掘R语言案例,希望对想了解R语言数据分析或者数据挖掘的童鞋有所帮助。

2016-02-04

Hadoop 1.0 API

只是英文版的,暂时还没有中文版的API,等到有了再共享给大家

2014-06-13

java就业培训教程

java快速入门教程,有问题的同学可以联系我,直接发给你们,省了下载了怪麻烦的。

2014-06-10

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除