分类回归树与随机森林

分 类 回 归 树 与 随 机 森 林 分类回归树与随机森林


机器学习:sklearn实现决策树和随机森林


Mushroom_CART


一 分类回归树


  • 模型:树(非参数模型)

  • 参数:分裂的特征及阈值

  • 目标函数
    – 损失函数:L2损失/GINI指数
    – 正则项:树的节点数目(L0)、叶子结点分数平方和(L2)

  • 优化
    – 建树
    – 剪枝


  • Classification And Regression Tree (CART): 机器学习十大算法之一,是一个用于监督学习的非参数模型
    二分递归分割:将当前样本集合划分为两个子样本集合,使得生成的每个非叶子结点都有两个分支–>生成的树是二叉树

在这里插入图片描述


回归树

在这里插入图片描述
例:预测t时刻我是否喜欢Romantic Music

在这里插入图片描述
在这里插入图片描述


树模型的优点

  • 容易解释
  • 不要求对特征做预处理
    – 能处理离散值和连续值混合的输入
    – 对特征的单调变换不敏感 (只与数据的排序有关)
    – 能自动进行特征选择
    – 可处理缺失数据
  • 可扩展到大数据规模

树模型的缺点

  • 正确率不高:建树过程过于贪心

– 可作为Boosting的弱学习器(深度不太深)

  • 模型不稳定(方差大):输入数据小的变化会带来树结构的变化

– Bagging:随机森林

  • 当特征数目相对样本数目太多时,容易过拟合

二 随机森林

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值