根据最优特征进行分类并创建决策树

当你获得一组数据

  头发  声音  性别
[['长', '粗', '男'],
 ['短', '粗', '男'],
 ['短', '粗', '男'],
 ['长', '细', '女'],
 ['短', '细', '女'],
 ['短', '粗', '女'],
 ['长', '粗', '女'],
 ['长', '粗', '女']]

该如何对它按照特征进行分类

当然,最简单的,可以利用groupby进行分组

import pandas as pd
dataset = [['长', '粗', '男'],
           ['短', '粗', '男'],
           ['短', '粗', '男'],
           ['长', '细', '女'],
           ['短', '细', '女'],
           ['短', '粗', '女'],
           ['长', '粗', '女'],
           ['长', '粗', '女']]
hair_list = []
voice_list = []
sex_list = []
for i in range(len(dataset)):
    hair_list.append(dataset[i][0])
    voice_list.append(dataset[i][1])
    sex_list.append(dataset[i][2])
data = pd.DataFrame({
    "hair": hair_list,
    "voice": voice_list,
    "sex": sex_list
})
group = data.groupby("sex")   # 按照sex进行分类
for i in list(group):         # 如果不追求美观的话此处循环也可用print(list(group))代替
    print(i)
    if i == ")":
        print("\n")

可以得到这样的输出结果

('女',   hair voice sex
3    长     细   女
4    短     细   女
5    短     粗   女
6    长     粗   女
7    长     粗   女)
('男',   hair voice sex
0    长     粗   男
1    短     粗   男
2    短     粗   男) 

但这毕竟是人为给定的分类结果,存在着数据量过大不好认为分析或分析错误的情况(不一定选择的特征就是最优特征&#

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值