转载请注明作者和出处:http://blog.csdn.net/u013829973
系统版本:window 7 (64bit)
文章出现的所有代码在我的GitHub:https://github.com/weepon
python版本:python 3.5
一、使用决策树预测隐形眼镜类型
在上一篇文章中,我们学习了决策树算法,接下来,让我们通过一个例子讲解决策树如何预测患者需要佩戴的隐形眼镜类型。
隐形眼镜数据集是非常著名的数据集,它包含了很多患者眼部状况的观察条件以及医生推荐的隐形眼镜类型。隐形眼镜类型包括硬材质(hard)、软材质(soft)以及不适合佩戴隐形眼镜(no lenses)。数据来源于UCI数据库,数据存储在文本文件中,数据集下载地址:下载
数据集信息:
* 特征有四个:age(年龄)、prescript(症状)、astigmatic(是否散光)、tearRate(眼泪数量)
* 隐形眼镜类别有三类(最后一列):硬材质(hard)、软材质(soft)、不适合佩戴隐形眼镜(no lenses)
在上篇文章的代码基本上,只需要在主函数改为如下代码即可。
if __name__ == '__main__':
fr = open('lenses.txt')
lenses = [inst.strip().split('\t') for inst in fr.readlines()]
print(lenses)
lensesLabels = ['age', 'prescript', 'astigmatic', 'tearRate']
myTree_lenses = createTree(lenses, lensesLabels)
createPlot(myTree_lenses)
运行结果: