机器学习之决策树算法(六)以西瓜数据集的离散特征和连续特征为例编写分类树

该博客通过西瓜数据集探讨机器学习中的决策树算法,涵盖了离散特征和连续特征的分类树构建。首先介绍数据集,接着进行数据分析,然后分别展示了离散特征和连续特征下决策树的代码实现,利用香农熵增益作为划分标准。
摘要由CSDN通过智能技术生成

西瓜数据集如下

    x1     x2     x3  label  score
0   青绿  0.697  0.460      0     71
1   乌黑  0.774  0.376      0     92
2   乌黑  0.634  0.264      0     86
3   青绿  0.608  0.318      0     79
4   浅白  0.556  0.215      0     91
5   青绿  0.403  0.237      0     88
6   乌黑  0.481  0.149      0     85
7   乌黑  0.437  0.211      0     94
8   乌黑  0.666  0.091      1     31
9   青绿  0.243  0.267      1     22
10  浅白  0.245  0.057      1     16
11  浅白  0.343  0.099      1     29
12  青绿  0.639  0.161      1     11
13  浅白  0.657  0.198      1     18
14  乌黑  0.360  0.370      1     15
15  浅白  0.593  0.042      1     24
16  青绿  0.719  0.103      1     18

数据分析

  • 分类标签是label
  • 回归标签是score
  • 离散型特征有x1
  • 连续型特征有x2,x3
  • 以香农熵增益为构树指标

离散特征构树代码实现如下

import pandas as pd
import numpy as np
path =
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值