决策树
文章平均质量分 64
菜地里翻滚的猪
It界的小鲁班
展开
-
机器学习实战--决策树(一)
决策树是一种通过推断分解,逐步缩小待推测事物范围的算法结构,重要任务就是理解数据中所蕴含的知识信息,可以使用不熟悉的数据集合,并从中提取出一系列规则,根据数据集创建规则的过程就是机器学习的过程。 优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征的数据。 缺点:可能产生过度匹配的问题。 ### 决策树的构造 使用信息论划分数据集,要知道当前数据集的哪个特征起决定性作...原创 2018-10-16 21:30:53 · 1269 阅读 · 0 评论 -
机器学习实战--决策树(二)
使用Matplotlib注解绘制树形图 annotation是注解工具,注解功能可以对文字着色,并提供多种形状以供选择,还可以反转箭头。创建名为treePlotter.py的新文件。 使用文本注解绘制树节点: #定义文本框和箭头格式 decisionNode = dict(boxstyle="sawtooth",fc="0....原创 2018-10-16 22:47:04 · 245 阅读 · 0 评论 -
机器学习实战--决策树(三)
测试:使用已有决策树执行分类 构造决策树之后,将用于实际数据的分类。执行数据分类时需要使用决策树以及用于构造决策树的标签向量。代码如下: ''' 该函数的inputTree是已经生成的决策树,是字典集,featLabels是要测试的数据特征的列表, testVec是与featLabels的特征列表中对应的特征值,注意位置需要对应。 输入形式如:classify(myTree,['no sur...原创 2018-10-16 23:16:57 · 330 阅读 · 0 评论