决策树学习算法最著名的主要有ID3决策树学习算法(ID:Iterative Dichotomiser),C4.5决策树算法等。一般来说,决策树算法最重要的是划分准则的选取,如常见 的有信息增益、增益率、基尼指数等。这些准则虽然对决策树的尺寸有较大的影响,但是对泛化性能影响很有限。因此需要对决策树进行剪枝,除去数据噪声,常见的剪枝方法有预剪枝和后剪枝两种。那么这两种方法有什么区别呢?预剪枝运用可能会导致欠拟合,而后剪枝则会导致时间的浪费,各有优缺点。不仅如此,决策树的属性有离散属性和连续属性之分。对于连续属性,我们可以运用二分法进行决策树连续属性的划分。最后决策树个人认为是个不错的分类方法。然后传个ID3 的java代码。
机器学习之决策树
最新推荐文章于 2024-07-06 22:59:16 发布