金融风控02

风控数据挖掘方法简介

决策树算法

决策树的生成只考虑局部最优,
决策树的剪枝则考虑全局最优。

从逻辑回归到决策树

决策树总体流程:
  • 自根至叶的递归过程
  • 在每一个中间节点寻找一个“划分”属性
三种停止条件
  • 当前节点的所有样本都属于某类
  • 当前属性值为空或所有属性值相当
  • 当前节点的样本为空
最佳属性划分依据
  • 信息增益:ID3,取值多的属性,信息增益更大,容易得到庞大但浅的树。分类
  • 信息增益率:C4.5,消除因特征取值越多,信息增益越大的情况。分类
  • 基尼系数:CART,最小化纯度。回归或分类
特征ID3C4.5CART
树种类非二叉树非二叉树二叉树
回归/分类分类分类回归&分类
特征利用不重复使用特征不重复使用特征重复使用特征
回归树
决策树优点:简单、逻辑清晰、可解释性好

逻辑回归算法
决策树算法

补充

bagging思想

  • 有放回的重复抽样。
  • 代表的方法:随机森林(行采样,列采样——加权投票)
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值