申请评分卡模型(汽车金融)

1.数据说明

本案例是基于一份汽车贷款违约数据建立的申请评分卡模型,表 1-1 对数据集中的变量进行简要说明,并给出数据清洗策略。其中是否违约 bad_ind 是因变量

表 1-1 数据集变量的简要说明
字段名中文含义数据清洗策略
application_id申请者ID
account_number帐户号
bad_ind是否违约(因变量)
vehicle_year汽车购买时间0代表缺失,使用适合众数填补
vehicle_make汽车制造商空白代表缺失,使用适合众数填补或单独分类
bankruptcy_ind曾经破产标识空白代表缺失,使用适合众数填补或单独分类
tot_derog五年内信用不良事件数量(比如手机欠费消号)缺失代表无记录,使用适合中位数填补
tot_tr全部帐户数量缺失代表系统内无记录,应该使用total open trade lines+两变量差值的均值
age_oldest_tr最久账号存续时间(月)缺失代表系统内无记录,使用均值或中位数填补
tot_open_tr在使用帐户数量缺失代表系统内无记录,应该使用total open revolving trade lines+两变量差值的均值
tot_rev_tr在使用可循环贷款帐户数量(比如信用卡)缺失代表系统内无记录,使用均值或中位数填补
tot_rev_debt在使用可循环贷款帐户余额(比如信用卡欠款)
tot_rev_line可循环贷款帐户限额(信用卡授权额度)
rev_util可循环贷款帐户使用比例(余额/限额)
fico_scoreFICO打分缺失代表系统内无记录,使用均值或中位数填补
purch_price汽车购买金额(元)
msrp建议售价0代表缺失,使用适合按照汽车制造商进行均值填补
down_pyt分期付款的首次交款
loan_term贷款期限(月)
loan_amt贷款金额
ltv贷款金额/建议售价*100
tot_income月均收入(元)
veh_mileage行使历程(Mile)
used_ind是否二手车

2. 拒绝推断(RI)

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import os
变量属性变量名含义acceptsrejects
缺失数量缺失率缺失数量缺失率
数值型application_id申请者ID00%00%
account_number帐户号00%--
bad_ind是否违约(因变量)00%--
vehicle_year汽车购买时间10%10%
bankruptcy_ind曾经破产标识2174%1554%
tot_derog五年内信用不良事件数量(比如手机欠费消号)2134%1333%
tot_tr全部帐户数量2144%1333%
age_oldest_tr最久账号存续时间(月)2164%1343%
tot_open_tr在使用帐户数量141932%99831%
tot_rev_tr在使用可循环贷款帐户数量(比如信用卡)63812%44512%
tot_rev_debt在使用可循环贷款帐户余额(比如信用卡欠款)4789%3308%
tot_rev_line可循环贷款帐户限额(信用卡授权额度)4789%3308%
rev_util可循环贷款帐户使用比例(余额/限额)00%00%
fico_scoreFICO打分3146%1824%
purch_price汽车购买金额(元)00%00%
msrp建议售价10%10%
down_pyt分期付款的首次交款00%00%
loan_term贷款期限(月)00%00%
loan_amt贷款金额00%00%
ltv贷款金额/建议售价*10010%00%
tot_income月均收入(元)50%20%
veh_mileage行使历程(Mile)10%10%
used_ind是否二手车00%00%
weight样本权重00%--
离散型vehicle_make汽车制造商2995%2446%
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值