机器学习3-决策树

最新推荐文章于 2022-06-23 00:37:12 发布

哎呦-_-不错

最新推荐文章于 2022-06-23 00:37:12 发布

阅读量454

点赞数

分类专栏： # 机器学习基础文章标签：决策树机器学习

本BLOG上原创文章未经本人许可，不得用于商业用途，转载请注明出处。

本文链接：https://blog.csdn.net/weixin_46649052/article/details/108415264

版权

文章目录

1.熵、条件熵

在这里插入图片描述

2.信息增益、ID3算法

1）信息增益

在这里插入图片描述

2）ID3算法构建决策树

在这里插入图片描述

3.ID3决策树的代码实现

import operator
import numpy as np

# 定义加载数据的函数
def loaddata():
    dataSet = [[0, 0, 0, 0, 'no'],
               [0, 0, 0, 1, 'no'],
               [0, 1, 0, 1, 'yes'],
               [0, 1, 1, 0, 'yes'],
               [0, 0, 0, 0, 'no'],
               [1, 0, 0, 0, 'no'],
               [1, 0, 0, 1, 'no'],
               [1, 1, 1, 1, 'yes'],
               [1, 0, 1, 2, 'yes'],
               [1, 0, 1, 2, 'yes'],
               [2, 0, 1, 2, 'yes'],
               [2, 0, 1, 1, 'yes'],
               [2, 1, 0, 1, 'yes'],
               [2, 1, 0, 2, 'yes'],
               [2, 0, 0, 0, 'no']]
    feature_name = ['age', 'job', 'house', 'credit']
    return dataSet, feature_name


# 定义计算数据集的熵的函数
def entropy(dataSet):
    # 数据量
    m = len(dataSet)
    # 标签不同类别的计数字典
    labelCounts = {
   }
    # 循环数据集
    for featVec in dataSet:
        currentLabel = featVec[-1]
        # 标签类别计数-如果字典中不存在则值为0，否则值加1
        if currentLabel not in labelCounts.keys():
            labelCounts[currentLabel] = 0
        labelCounts[currentLabel] += 1
    # 定义一个自变量来保存熵
    e = 0.0
    # 根据公式计算熵
    for key in labelCounts:
        prob = float(labelCounts[key]) / m
        e -= prob * np.log2(prob)
    return e


# 定义划分数据集的函数-得到对应于axis与values的数据集
def splitDataSet(dataSet, axis, value):
    # 按轴与值划分好的数据集
    retDataSet = []
    # 循环数据集
    for featVec in dataSet:
        # 当前数据按轴取出的数据符合传入的value值
        if featVec[axis] == value:
            temDataSet = featVec[:axis]
            temDataSet.extend(featVec[axis + 1:])
            retDataSet.append(temDataSet)
    return retDataSet


#

最低0.47元/天解锁文章

哎呦-_-不错

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
机器学习3-决策树

文章目录1.熵、条件熵2.信息增益、ID3算法1）信息增益2）ID3算法构建决策树3.ID3决策树的代码实现4.C4.5决策树5.基尼指数生成决策树6.预剪枝与后剪枝7.决策树处理连续值与缺失值8.多变量决策树9.sklearn实现决策树10.案例：使用决策树进行个人信用风险评估1.熵、条件熵2.信息增益、ID3算法1）信息增益2）ID3算法构建决策树3.ID3决策树的代码实现import operatorimport numpy as np# 定义加载数据的函数def l
复制链接

扫一扫