c4.5算法 java_Weka J48决策树算法(C4.5)源码学习 | 学步园

本文通过阅读Weka的源代码,详细介绍了如何使用Java实现C4.5决策树算法,即J48。首先,介绍了决策树学习算法的基础知识,如熵、信息增益和信息增益率。接着,逐步解析了J48的代码流程,从J48.buildClassifier开始,涉及C45ModelSelection、C45Split等关键类的方法。最后,讨论了C4.5决策树的剪枝过程及其错误率计算。
摘要由CSDN通过智能技术生成

代码下载:

Use WEKA in your Java Code:

1901041.html

1901041.html

J48 C4.5决策树

TODO: J48 的分类效率分析。

题记: 之前虽然对 J48 用得比较多,是由于它能方便的区别特征的好坏。 工作了,希望自己能更深入, 如是开始了这个算法学习系列。 希望和大家共同进步。

个人对看算法源代码也没有很好的流程,计划先采用 按类Class 做架构介绍;再深入代码具体逻辑的方式展开。 欢迎大家提出好的算法源码阅读流程。

另外,求推荐LR 的比较好的实现代码 ~(^o^)~

一、 准备工作。

下载 weka  的工具包,将 weka.jar 和 weka-src.jar 导入eclipse 项目的依赖包,即可查看 到源码。

也可以将weka-src.jar 解压,在对应的文件夹下建立一个单独的eclipse 项目,这样可以自己修改代码。

相关论文参考: Ross Quinlan (1993). C4.5: Programs for Machine Learning. Morgan Kaufmann Publishers, San Mateo, CA.

因为还是对 E文 不友好,个人看了 统计学习方法 的对应章节就算是把理论先过完啦。

熵用来计算随机量的分布不确定性,或者其表达能力。计算公式࿱

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值