数据挖掘中可以用“决策树”技术进行归纳分类。
1.决策树的构造:
常用的算法有:ID3,C4.5,CART(贪心方法,非回溯的);可伸缩性比较好的有:SLIQ和SPRINT,雨林,BOAT。其中BOAT是可以增量更新的。
2.决策树的约简:
减小错误修剪法,悲观错误修剪法,基于代价-复杂度的修剪法,代价敏感的决策树修剪法......
简化决策树的方法绝不止这些,各种不同的方法觉有自己的优点和缺点。实际运用时应根据实际情况进行选择,当然算法也是,毕竟算法也都有各自的应用领域。(所以,如果要进行这方面的理论创新,应该基于实际的应用,有项目的话,更好。)
3.决策树目前主要的研究方向:
1)与其他技术的结合:
决策树与神经网络的结合:通过先生产决策树,然后根据决策树来重新构造多层神经网络,以加快神经网络的训练速度。相反,也可以用神经网络来得到所需的决策树,此法解决了由神经网络得到的知识难于被人们理解的缺点。
决策树与模糊集合原理的结合 决策树不稳定,这样两者结合,弥补它的不足,(参考软决策树)
决策树与进化算法,遗传算法及遗传编程的结合 可以较好的在并行计算机上运行,提高运算能力,进化算法为随机算法,对同一数据集可以产生不通的决策树,这样可以从中选择一个最优的。....