使用weka做分类任务并建立相应决策树(ID3算法和C4.5算法)
- weka安装
- 相关知识理论
2.1 决策树
2.2 ID3算法
2.3 C4.5算法 - 分类实验
3.1 数据处理
3.2 使用ID3算法
3.3 使用C4.5算法
3.4 ID3和C4.5的比较 - 总结
1.weka安装
weka官网Download地址:
https://www.cs.waikato.ac.nz/ml/weka/downloading.html
注意有带java环境和不带java环境的版本,如果电脑中有JRE环境选择后者安装。
2.相关理论知识
2.1 决策树
决策树是一种特殊的树形结构,一般由节点和有向边组成。其中,节点表示特征、属性或者一个类。而有向边包含有判断条件。决策树从根节点开始延伸,经过不同的判断条件后,到达不同的子节点。而上层子节点又可以作为父节点被进一步划分为下层子节点。一般情况下,我们从根节点输入数据,经过多次判断后,这些数据就会被分为不同的类别。这就构成了一颗简单的分类决策树。分类树的输出是一个标量,而回归树的一般输出为一个实数。
决策树学习三个阶段:特征选择、树的生成、树的修剪
特征选择:特征选择是指从训练数据中众多的特征中选择一个特征作为当前节点的分裂标准,如何选择特征有着很多不同量化评估标准标准ÿ