toad导入数据_超级专业好用的python分箱工具toad

最新推荐文章于 2024-05-16 16:26:14 发布

呗老心眼极小

最新推荐文章于 2024-05-16 16:26:14 发布

阅读量1.9k

点赞数 2

文章标签： toad导入数据

本文链接：https://blog.csdn.net/weixin_30219613/article/details/112477267

版权

本文介绍了如何使用Python中的Toad工具进行数据分箱，特别是在智能风控领域的应用。通过数据预处理、特征筛选、卡方分箱等步骤，确保模型稳定性和样本量，优化特征的坏账率分布。

摘要由CSDN通过智能技术生成

最近在看一本关于智能风控的书，虽然自己的工作并非金融行业，但是里面的分析思路还是非常值得学习，下面就分享一个在书里面学到的非常好用的分箱工具-toad

为了提升模型的稳定性，和保证每个特征的样本量，通常需要对特征进行分箱(类似于分组)，一般把变量分成6-10箱，每箱负样本占比差距尽量大，并且每箱样本量不低于总样本量的5%。

step1

首先进行数据的预处理

#导入数据import pandas as pdimport numpy as npdf= pd.read_csv(open(r'F:\建模数据.csv'))#分成三部分l=df.shape[0]devp=int(l*0.6)valp=int(l*0.8)df["type"]=1df["type"][:devp]="dev" df["type"][devp:valp]="val"df["type"][valp:]="off"#设置排除列ex_lis=["tel","type","target"]ft_lis=list(df.columns)for i in ex_lis:    ft_lis.remove(i)#提取三部分的数据dev=df[df["type"]=="dev"]val=df[df["type"]=="val"]off=df[df["type&#

最低0.47元/天解锁文章

呗老心眼极小

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
toad导入数据_超级专业好用的python分箱工具toad

最近在看一本关于智能风控的书，虽然自己的工作并非金融行业，但是里面的分析思路还是非常值得学习，下面就分享一个在书里面学到的非常好用的分箱工具-toad为了提升模型的稳定性，和保证每个特征的样本量，通常需要对特征进行分箱(类似于分组)，一般把变量分成6-10箱，每箱负样本占比差距尽量大，并且每箱样本量不低于总样本量的5%。step1首先进行数据的预处理#导入数据import pandas ...
复制链接

扫一扫