python风控工具_Toad | Pyhon评分卡工具轻松实现风控模型开发

最新推荐文章于 2024-07-11 16:26:14 发布

weixin_39830313

最新推荐文章于 2024-07-11 16:26:14 发布

阅读量2.9k

点赞数 2

文章标签： python风控工具

本文介绍了Toad，一个由厚本金融风控团队开发的评分卡模型库，具有功能全面、性能稳定等特点。通过示例，展示了如何使用Toad进行数据加载、特征筛选、分箱、WOE映射、模型训练等步骤，帮助读者理解评分卡的构建方法。文章还提及了Toad与Scorecardpy等其他工具的比较。

摘要由CSDN通过智能技术生成

前言

介绍一个超级、超级、超级强大的评分卡模型开发库。很多从业者都知道信贷风控界有一个库叫做Scorecardpy。作者是谢士晨博士。今天为读者介绍另一个同样用于开发评分卡的库，名为toad。

⭐️toad是由厚本金融风控团队内部孵化，后开源并坚持维护的标准化评分卡库。其功能全面、性能稳健、运行速度快、问题反馈后维护迅速、深受同行喜爱。如果有些小伙伴没有一些标准化的信用评分开发工具或者企业级的定制化脚本，toad应该会极大的节省大家的时间。

本文以一个不能分享的数据为例，演示一下toad包的功能，同时为读者讲解一下评分卡的构建方法。没有真实数据又对此感兴趣的胖友，其实可以随便从网上找个二分类项目，或者使用一些风控竞赛的开源数据。

正文

⭐️首先加载本文所需的库。

import pandas as pd

from sklearn.metrics import roc_auc_score,roc_curve,auc

from sklearn.model_selection import train_test_split

from sklearn.linear_model import LogisticRegression

from sklearn.model_selection import GridSearchCV as gscv

from sklearn.neighbors import KNeighborsClassifier

import numpy as np

import glob

import math

import xgboost as xgb

import toad

⭐️加载数据。

#加载数据path = "D:/风控模型/data/"

data_all = pd.read_csv(path+"data.txt",engine='python',index_col=False)

data_all_woe = pd.read_csv(path+"ccard_all_woe.txt",engine='python',index_col=False)

#指定不参与训练列名

ex_lis = ['uid','obs_mth','ovd_dt','samp_type','weight',

'af30_status','submit_time','bad_ind']

#参与训练列名

ft_lis = list(data_all.columns)

for i in ex_lis:

ft_lis.remove(i)

⭐️划分训练集与测试集。

#训练集与跨时间验证集合

dev = data_all[(data_all['samp_type'] == 'dev') |

(data_all['samp_type'] == 'val') |

(data_all['samp_type'] == 'off1') ]

off = data_all[data_all['samp_type'] == 'off2']

⭐️EDA，探索性数据分析同时处理数值型和字符型。

a = toad.detector.detect(data_all)

a.head(8)

⭐️特征筛选empty：缺失率上限

iv：信息量

corr：相关系数大于阈值，则删除IV小的特征

return_drop：返回删除特征

exclude：不参与筛选的变量名

dev_slct1, drop_lst= toad.selection.select(dev,dev['bad_ind'], empty = 0.7,

iv = 0.02, corr = 0.7, return_drop=True, exclude=ex_lis)

print("keep:",dev_slct1.shape[1],

"drop empty:",len(drop_lst['empty']),

"drop iv:",len(drop_lst['iv']),

"drop corr:",len(drop_lst['corr']))

keep: 584

drop empty: 637

drop iv: 1961

最低0.47元/天解锁文章

weixin_39830313

关注

2
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
python风控工具_Toad | Pyhon评分卡工具轻松实现风控模型开发

前言介绍一个超级、超级、超级强大的评分卡模型开发库。很多从业者都知道信贷风控界有一个库叫做Scorecardpy。作者是谢士晨博士。今天为读者介绍另一个同样用于开发评分卡的库，名为toad。⭐️toad是由厚本金融风控团队内部孵化，后开源并坚持维护的标准化评分卡库。其功能全面、性能稳健、运行速度快、问题反馈后维护迅速、深受同行喜爱。如果有些小伙伴没有一些标准化的信用评分开发工具或者企业级的定制化...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。