实验3 决策树分类实验上
一、实验要求
在计算机上验证和测试招聘数据的决策树分类实验,理解对离散特征如何根据信息熵生成决策树。
- 实验目的
1、掌握决策树分类的原理
2、能够实现决策树分类算法;
三、实验内容
实验步骤
- 请阅读DecisionTree代码,解释_genTree函数是如何一步步生成决策树的。
- 请完成predict函数,实现决策树对新样本数据的分类识别,并测试识别效果
predictOne函数预测单个样本是否被录用(返回yes 或 no):
通过递归函数,通过字典中的键与样本单个数据x对应,逐层对应字典中的值,直到对应出yes或者no,递归结束
Predict函数调用predictOne函数,将结果储存为一个列表,供accuracy_score函数计算准确率
以X原始数据为测试集,预测的结果列表如下:
与原始标签集y完全对应
四、实验总结
1、掌握了决策树分类的原理
2、能够实现决策树分类算法
3. 字典的基础知识薄弱其中
字典的keys方法返回的对象不支持索引,此处报错耗费较多时间
4.递归预测函数的逻辑掌握不熟练,编写有难度,耗时较多