toad导入数据_超级专业好用的python分箱工具toad

本文介绍了如何使用Python中的Toad工具进行数据分箱,特别是在智能风控领域的应用。通过数据预处理、特征筛选、卡方分箱等步骤,确保模型稳定性和样本量,优化特征的坏账率分布。
摘要由CSDN通过智能技术生成

最近在看一本关于智能风控的书,虽然自己的工作并非金融行业,但是里面的分析思路还是非常值得学习,下面就分享一个在书里面学到的非常好用的分箱工具-toad

为了提升模型的稳定性,和保证每个特征的样本量,通常需要对特征进行分箱(类似于分组),一般把变量分成6-10箱,每箱负样本占比差距尽量大,并且每箱样本量不低于总样本量的5%。

step1

首先进行数据的预处理

#导入数据import pandas as pdimport numpy as npdf= pd.read_csv(open(r'F:\建模数据.csv'))#分成三部分l=df.shape[0]devp=int(l*0.6)valp=int(l*0.8)df["type"]=1df["type"][:devp]="dev" df["type"][devp:valp]="val"df["type"][valp:]="off"#设置排除列ex_lis=["tel","type","target"]ft_lis=list(df.columns)for i in ex_lis:    ft_lis.remove(i)#提取三部分的数据dev=df[df["type"]=="dev"]val=df[df["type"]=="val"]off=df[df["type&#
  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值