机器学习之决策树

决策树学习算法最著名的主要有ID3决策树学习算法(ID:Iterative Dichotomiser),C4.5决策树算法等。一般来说,决策树算法最重要的是划分准则的选取,如常见 的有信息增益、增益率、基尼指数等。这些准则虽然对决策树的尺寸有较大的影响,但是对泛化性能影响很有限。因此需要对决策树进行剪枝,除去数据噪声,常见的剪枝方法有预剪枝和后剪枝两种。那么这两种方法有什么区别呢?预剪枝运用可能会导致欠拟合,而后剪枝则会导致时间的浪费,各有优缺点。不仅如此,决策树的属性有离散属性和连续属性之分。对于连续属性,我们可以运用二分法进行决策树连续属性的划分。最后决策树个人认为是个不错的分类方法。然后传个ID3 的java代码。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值