vue引入id3_使用决策树ID3算法,预测收入是否大于50k

本文介绍了一个简单的决策树ID3算法实现,用于预测个人收入是否超过50k。由于数据集过大,导致栈溢出问题,仅能对部分数据进行预测。文章提供了代码实现,并展示了在一小部分数据上的预测结果。
摘要由CSDN通过智能技术生成

算法比较简单,没有涉及剪枝和限制树深,懒得写.. 实现完算法在数据集上跑了一遍,发现数据集太大导致栈溢出,所以只能预测部分数据了,谁知道比较好的优化办法欢迎交流~

数据:

列描述信息

代码:

import pandas as pd

import numpy as np

import math

import sys

col_names=['age','workclass','fnlwgt','education','education_num',

'marital_status','occupation','relationship','race','sex',

'capital_gain','capital_loss','hours_per_week','native_country','high_income']

income=pd.read_table('./data/income.data',sep=',',names=col_names)

#sys.setrecursionlimit(1000) 尝试用sys解决溢出,无效

#处理数据

columns=['workclass','education',

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值