决策分类树可视化以及手写代码寻找最佳分裂标准

本文探讨了使用决策树解决QQ用户真实性的分类问题,通过可视化展示决策树,并详细介绍了如何手写代码依据信息熵增益选择最佳分裂条件,以实现最优的决策树划分。
摘要由CSDN通过智能技术生成

问题介绍

决策树是一种非线性解决回归或者分类的思路,这篇文章是从QQ的好友密度,日志密度,以及真实头像和QQ是否是真实用户的相关性出发,利用决策树分析问题。并且画出了决策树,还手写代码实现了决策树的分裂标准。

决策树可视化

# 导包
import pandas as pd 
import numpy as np
from sklearn.tree import DecisionTreeClassifier # tree模块中有回归树和分类树,此处导入分类树
from sklearn import tree

# 构建数据,s,m,l分别表示小,中,大
y = np.array(list('NYYYYYNYYN'))
X = pd.DataFrame({
   '日志密度':list('sslmlmmlms'),
                  '好友密度':list('slmmmlsmss'),
                  '真实头像':list('NYYYYNYYYY')})
X
日志密度 好友密度 真实头像
0 s s N
1 s l Y
2 l m Y
3 m m Y
4 l m Y
5 m l N
6 m s Y
7 l m Y
8 m s Y
9 s s Y
# 在算法中计算,必须是数字,对字符串做相应的转换
X['日志密度']=X['日志密度'].map({
   's':0,'m':1,'l':2})
X['好友密度']=X['好友密度'].map({
   's':0,'m':1,'l':2})
X['真实头像']=X
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

python_xiaofeng

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值