Python数据分析——基于CART决策树的用户识别

项目要求

        传统的偷漏税分析是通过人工检测来进行的,对人的依赖性太大,为了提高偷漏税的判别效率,拟决定先根据商户的纳税数据进行初步的自动判断,对于判别为偷漏税的用户再进行人工检测。

 

数据集

        本文提供的数据集指标类型如下,一共124条记录。

 

 

数据探索        


        对数据集进行缺失值分析,未发现缺失值

 

import pandas as pd
data = pd.read_excel('C:\Python27\chapter6\exam\model', index_col = 0)
data.describe()

        

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值