决策树学习笔记

最新推荐文章于 2024-01-20 20:16:19 发布

子曰制鱼

最新推荐文章于 2024-01-20 20:16:19 发布

阅读量83

点赞数

决策树学习笔记

前言
决策树简介
决策树代码实现（python）
划分选择
减值处理
连续缺失值处理
多变量决策树

前言

本文内容参考了周志华老师的《机器学习》，《机器学习实战》，和李航老师的《统计学习方法》

决策树简介

决策树是一种很常见的机器学习方法

例如判断一个西瓜是好瓜还是坏瓜？
在这里插入图片描述

决策树代码实现（python）

下面我们来看如何用代码来实现

首先我们先来编写计算香农熵的代码

from math import log

def calc_shannong_ent(data_set):
	//计算一共有多少条数据
    data_size = len(data_set)
    //统计所有的结果
    data_labels=[example[-1] for example in data_set]
    labels_num ={}
    for i in data_labels:
        labels_num[i] = labels_num.get(i, 0) + 1
    shannong_ent = 0
   //计算香农熵
    for key in labels_num:
        prob = labels_num[key] / data_size
        shannong_ent = shannong_ent - prob * log(prob, 2)
    return shannong_ent

我们验证这个函数

print(calc_shannong_ent([[1,1,"yes"],[1,1,"yes"],[1,0,"no"],[0,1,"no"],[0,1,'no']]))

输出结果为

0.970950594454668

然后编写划分数据集的代码

def splite(data_set, axis, value):
    rem_data_set=[]
    for line_data in data_set:
        if line_data[axis] == value:
            data = line_data[:axis]
            data.extend(line_data[axis+1:])
            rem_data_set.append(data)
    return rem_data_set

划分选择

减值处理

连续缺失值处理

多变量决策树

子曰制鱼

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
决策树学习笔记

决策树学习笔记前言决策树简介决策树代码实现划分选择减值处理连续缺失值处理多变量决策树前言本文内容参考了周志华老师的《机器学习》，《机器学习实战》，和李航老师的《统计学习方法》决策树简介决策树是一种很常见的机器学习方法例如判断一个西瓜是好瓜还是坏瓜？决策树代码实现划分选择减值处理连续缺失值处理多变量决策树...
复制链接

扫一扫