woe分析_Toad — 分析金融数据提升生产力的工具

Toad是一个适用于金融场景的数据分析库,包括数据探索、特征选择、WOE变换、模型验证和评分卡分数转换等功能。通过Combiner()对象实现分箱合并,支持多种分箱方法如卡方、决策树和百分位。此外,提供可视化工具帮助调整分箱逻辑,并具备全面的模型验证指标,如KS、F1和AUC。
摘要由CSDN通过智能技术生成

865b50cdef11e3e26b19f300846f3ca6.png

Toad的基本概念.

  • Toad是一个用于在金融场景下分析数据非常方便的库,我这篇是打算根据文档配上例子撸一遍.
  • Toad分为9个子模块.
  1. toad.detecor module 精细版describe
  2. toad.merge module 专门针对分箱
  3. toad.metrics module Sklearn没有的偏金融模型评价指标
  4. toad.plot module 作图模块
  5. toad.scorecard module 直接做卡模块
  6. toad.selection module 看函数是用于根据不同评价指标删除特征用的
  7. toad.stats module 计算特征的熵,基尼系数等,iv,badrate等
  8. toad.transform module Woe转换
  9. toad.utils module 黑人问号?
toad.detector module​toad.readthedocs.io

Basic Tutorial For Toad

接下来跟着官方文档过一遍Toad的基本功能,使用的数据集可以在这里下载,例子分为五部分:

  1. EDA
  2. 特征选择,WOE分箱
  3. 模型挑选
  4. 模型验证
  5. 分数变换
#!pip install --upgrade toad
import pandas as pd
import numpy as np
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split

import toad # Our Main Character Today!

data = pd.read_csv('german_credit_data.csv')
data.drop('Unnamed: 0',axis=1,inplace=True)
data.replace({
    'good':0,'bad':1},inplace=True)

5deb1e5d3d975a5f28dd72796b379edd.png
Xtr,Xts,Ytr,Yts = train_test_split(data.drop('Risk',axis=1),data['Risk'],test_size=0.25,random_state=450)

data_tr = pd.concat([Xtr,Ytr],axis=1)
data_tr['type'] = 'train'

data_ts = pd.concat([Xts,Yts],axis=1)
data['type'] = 'test'
print(data_tr.shape)

使用toad.detector.detect()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值