1. 决策树与CART

    分类决策树模型是一种描述对实例进行分类的树型结构。

 

    算法流程:递归的选取一个最优特征,根据该特征 对训练数据进行分割,使得各个子数据集有一个最好的分类过程。如果这些子集已经能够正确被分类了(就是说所有数据的类别都是一个), 就可以构建叶子节点,把 这些子集对应到叶子节点中去。不然,任然要选取新的最优特征,继续进行分割,直到所有的训练子集全都被正确分类,每个子集都被分配到了叶子节点上,就完成了决策树的构建。

 

    用决策树进行分类就是从根节点开始,对实例某一特征进行测试,根据测试结果,将实例分到其子节点,这个时候,每个子节点对应了 该特征的一个取值。这样递归的对实例进行测试分配,直到达到叶节点。将实例分配到叶节点对应的类中

    决策树学习的本质就是从训练数据集中归纳出一组规则,与训练数据矛盾最小,同时具有较好泛化能力。决策树学习就用极小化损失函数来实现这一个目标。

    过拟合解决方法:以上的决策树构建方法会对训练数据有很好地分类效果,但是可能产生过拟合, 因为过多的考虑了如何对训练数据进行正确分类。我们需要对已知的决策树进行自下而上的剪枝,去掉过于细分的叶节点,使其退回到父节点,甚至更高的节点,然后将父节点或者更高的节点作为叶子节点。

 

    概括来说,决策树算法包括:特征选择, 决策树生成, 剪

 

    特征选择

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值