决策树的建立步骤（西瓜书例题）

最新推荐文章于 2024-04-30 17:00:19 发布

yiyue21

最新推荐文章于 2024-04-30 17:00:19 发布

阅读量3.0k

点赞数 1

分类专栏：机器学习

本文链接：https://blog.csdn.net/yiyue21/article/details/89814753

版权

树的建立步骤：引入包、数据的获取与处理、获取名称与类别标记——>选择样本最多的类作为类别标记——>重点来了，计算信息熵——>子数据集构建——>计算信息增益——>选择最优属性——>建立决策树。这些步骤搞懂了，基本就理解了决策树的原理。

import pandas as pd
import numpy as np
from collections import Counter
from math import log2


# In[56]:


#数据获取与处理
def getData(file_Path):
    file_path = r'F:date427\decisionTree\xigua.xls'
    data = pd.read_excel( file_path)
    return data

def dataDeal(data):
    dataList = np.array(data).tolist()    #将矩阵转化成列表
    dataSet = [element[1:] for element in dataList]
    return dataSet


# In[57]:


#获取属性名称
def getLabels(data):
    labels = list(data.columns)[1:-1]
    return labels


# In[58]:


#获取类别标记
def targetClass(dataSet):
    classification = set([element[-1] for element in dataSet])
    return classification


# In[59]:


#将分支结点标记为叶结点，选择样本数最多的类作为类标记
def majorityRule(dataSet):
    mostKind = Counter([element[-1]

最低0.47元/天解锁文章

yiyue21

关注

1
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
决策树的建立步骤（西瓜书例题）

树的建立步骤：引入包、数据的获取与处理、获取名称与类别标记——>选择样本最多的类作为类别标记——>重点来了，计算信息熵——>子数据集构建——>计算信息增益——>选择最优属性——>建立决策树。这些步骤搞懂了，基本就理解了决策树的原理。import pandas as pdimport numpy as npfrom collections import ...
复制链接

扫一扫