- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 R做评分卡模型-实战
样本表现定义 变量含义 EDA与数据描述读入数据x<-read.csv('/Users/cc/Downloads/评分卡模型——具体举例/data1.csv',header=T,sep=',',fileEncoding = 'GBK')n <- length(x$order_id)data <- subset (x,x$BILL_CNT_L...
2018-04-09 10:31:33 977
原创 r do call
函数 call 允许通过函数名字和参数列表创建一个调用对象 x <- 10.5 > call(“round”, x) round(10.5)如上所见, 是x的值而不是符号 加入了调用中,因此和 round(x)有明显的差异。这种形式用的非常地少,但是当一个函数的名字可以作为一个字符变量时,这会非常有用。 函数 do.call 是相关的,但会立即对...
2018-04-26 11:54:52 728 1
原创 rpart 决策树
节点和结点的区别:节点为两线相交,不为终点;而结点为两线相交为终点,没有延伸; 1.分支节点:它指向其他的节点,所以是度不为0的节点。 vs 叶子结点:度为0的结点 2.度:结点拥有的子树数;就是说这个结点下面有几条分支 3.树的深度:树有几层 4.10折交叉验证:常用的测试算法准确性的方法。 将数据集分成10份,轮流将其中9份作为训练数据,1份作为测试数据,进行试验 每次试验...
2018-04-25 10:46:49 2476
原创 R smbinning包详解
做评分卡用到 整理一下smbinningOptimal Binning for Scoring Modeling 最佳分箱将数字特征归类为分数模式中的其他用途。 这个过程,也称为监督离散化,利用递归分区来将数字特征分类。 特定的算法是条件推测决策树(Conditional Inference Trees),它最初排除缺失值(NA)以计算切点,并在计算信息值的过程中稍后添加它们...
2018-04-04 16:16:23 7794
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人