自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (1)
  • 收藏
  • 关注

原创 R做评分卡模型-实战

样本表现定义 变量含义 EDA与数据描述读入数据x<-read.csv('/Users/cc/Downloads/评分卡模型——具体举例/data1.csv',header=T,sep=',',fileEncoding = 'GBK')n <- length(x$order_id)data <- subset (x,x$BILL_CNT_L...

2018-04-09 10:31:33 977

原创 r do call

函数 call 允许通过函数名字和参数列表创建一个调用对象 x <- 10.5 > call(“round”, x) round(10.5)如上所见, 是x的值而不是符号 加入了调用中,因此和 round(x)有明显的差异。这种形式用的非常地少,但是当一个函数的名字可以作为一个字符变量时,这会非常有用。 函数 do.call 是相关的,但会立即对...

2018-04-26 11:54:52 728 1

原创 rpart 决策树

节点和结点的区别:节点为两线相交,不为终点;而结点为两线相交为终点,没有延伸; 1.分支节点:它指向其他的节点,所以是度不为0的节点。 vs 叶子结点:度为0的结点 2.度:结点拥有的子树数;就是说这个结点下面有几条分支 3.树的深度:树有几层 4.10折交叉验证:常用的测试算法准确性的方法。 将数据集分成10份,轮流将其中9份作为训练数据,1份作为测试数据,进行试验 每次试验...

2018-04-25 10:46:49 2476

原创 R smbinning包详解

做评分卡用到 整理一下smbinningOptimal Binning for Scoring Modeling 最佳分箱将数字特征归类为分数模式中的其他用途。 这个过程,也称为监督离散化,利用递归分区来将数字特征分类。 特定的算法是条件推测决策树(Conditional Inference Trees),它最初排除缺失值(NA)以计算切点,并在计算信息值的过程中稍后添加它们...

2018-04-04 16:16:23 7794

评分卡_分箱

定义了多种分箱,也便于做单变量分析。决策时分箱,自定义阈值分箱等等。

2018-11-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除