构建信用卡客户风险评价关键特征
实训数据:https://pan.baidu.com/s/1RduW2P0UtdgvQowIu26u7A
1 实训目标
(1) 掌握评分卡模型的原理。
(2) 构建信用卡用户风险分析关键特征。
2 实训环境
(1) 使用 3.6 版本的 Python 。
(2) 使用 jupyter notebook 编辑器。
(3) os , pandas , N umPy , sklearn 。
3 实训内容
在信用卡相关的征信工作中,主要从三个方向判定客户的信用等级,分别为:客户的历史信用风险,客户的现阶段经济状况,客户的未来经济收入以及目前的收入的稳定情况。
4 实训步骤
(1) 据特征瑕疵户,逾期,呆账,强制停卡,退票,拒往记录构建历史行为特征。
(2) 根据特征借款余额,个人月收入,个人月开销,家庭月收入和月刷卡金额,构建出经济风险情况特征。
(3) 根据特征职业,年龄,住家,构建出收入风险情况特征。
(4) 标准化历史行为,经济风险情况,收入风险情况特征。
4.1 特征选取
特征的轩主主要是以下三个方面。具体操作如 代码 4‑1 所示。
- 根据特征瑕疵户,逾期,呆账,强制停卡,退票,拒往记录构建历史行为特征。
- 根据特征借款余额,个人月收入,个人月开销,家庭月收入和月刷卡金额,构建出经济风险情况特征。
- 根据特征职业,年龄,住家,构建出收入风险情况特征。
代码 4 ‑ 1 特征选取
In[1]:
import os
import numpy as np
import pandas as pd
os.chdir('/course/Python 数据分析与应用 /')
data8 = pd.read_csv('./tmp/data8.csv',encoding='utf-8',index_col=0, engine = 'python')
# 选取历史行为特征
card_selection1 = data8[[' 瑕疵户 ',' 逾期 ',' 呆账 ',' 强制停卡记录 ',' 退票 ',' 拒往记录 ']]
print(' 构建历史行为特征前 5 个特征为: \n',card_selection1.head())
Out[1]:
构建历史行为特征前 5 个特征为:
瑕疵户 逾期 呆账 强制停卡记录 退票 拒往记录
0 2 2 2 2 2 2
1 2 2