决策树算法python源代码_day-8 python自带库实现ID3决策树算法

前一天,我们基于sklearn科学库实现了ID3的决策树程序,本文将基于python自带库实现ID3决策树算法。

一、代码涉及基本知识

1、 为了绘图方便,引入了一个第三方treePlotter模块进行图形绘制。该模块使用方法简单,调用模块createPlot接口,传入一个树型结构对象,即可绘制出相应图像。

2、  在python中,如何定义一个树型结构对象

可以使用了python自带的字典数据类型来定义一个树型对象。例如下面代码,我们定义一个根节点和两个左右子节点:

rootNode = {'rootNode': {}}

leftNode= {'leftNode': {'yes':'yes'}}

rightNode= {'rightNode': {'no':'no'}}

rootNode['rootNode']['left'] =leftNode

rootNode['rootNode']['right'] =rightNode

treePlotter.createPlot(rootNode)

通过调用treePlotter模块,绘制出如下树的图像

9e5e00896e776baf73086cbb2062b7c4.png

2、  递归调用

为了求每个节点的各个子节点,要用到递归的方法来实现,基本思想和二叉树的遍历方法一致,后面我们还会用Python实现一个二叉树源码,此处不再进行介绍。

3、  此外,还需要对python常用的数据类型及其操作比较了解,例如字典、列表、集合等

二、程序主要流程

80db53b381b5703eb644e377231711dd.png

三、测试数据集

age

income

student

credit_rating

class_buys_computer

youth

high

no

fair

no

youth

high

no

excellent

no

middle_aged

high

no

fair

yes

senior

medium

no

fair

yes

senior

low

yes

fair

yes

senior

low

yes

excellent

no

middle_aged

low

yes

excellent

yes

youth

medium

no

fair

no

youth

low

yes

fair

yes

senior

medium

yes

fair

yes

youth

medium

yes

excellent

yes

middle_aged

medium

no

excellent

yes

middle_aged

high

yes

fair

yes

senior

medium

no

excellent

no

四、程序代码

1、计算测试集熵及信息增益

#求最优的根节点

defchooseBestFeatureToSplit(datase

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值