基于sklearn的决策树分类器

最新推荐文章于 2024-04-16 18:25:45 发布

无用技术研究所

最新推荐文章于 2024-04-16 18:25:45 发布

阅读量736

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44546360/article/details/89877984

版权

理论基础

决策树

决策树是一种树形结构的机器学习算法，所有的样本起始于根节点，每个具有子节点的父节点都有一个判断，根据判断结果将样本向子节点分流，测试样本从根节点开始向下流动，通过判断最终到达某个没有子节点的叶子节点，这个节点就是该样本所属的类别。
例如，判断一个动物是鸭子，狗还是兔子，可以具有以下的决策树：

判断是否有四条腿
- 没有，是鸭子
- 有，判断眼睛颜色
  - 红色，是兔子
  - 非红色，是狗

决策树训练算法

训练决策树时，可以描述如下

从父节点找到最优划分属性
根据属性划分出子节点
若子节点为空/属性相同（无需划分）或样本相等（无法划分），返回，否则返回第一步继续递归划分

找到最优划分属性时，计算按每个属性划分的信息熵，取信息熵最大的属性为最优划分属性

代码实现

载入数据——泰坦尼克号数据导入

import pandas as pd

titan = pd.read_csv("http://biostat.mc.vanderbilt.edu/wiki/pub/Main/DataSets/titanic.txt")
print(titan.head())

   row.names

最低0.47元/天解锁文章

无用技术研究所

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
基于sklearn的决策树分类器

理论基础决策树决策树是一种树形结构的机器学习算法，所有的样本起始于根节点，每个具有子节点的父节点都有一个判断，根据判断结果将样本向子节点分流，测试样本从根节点开始向下流动，通过判断最终到达某个没有子节点的叶子节点，这个节点就是该样本所属的类别。例如，判断一个动物是鸭子，狗还是兔子，可以具有以下的决策树：判断是否有四条腿没有，是鸭子有，判断眼...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。