机器学习实战——金融风控业务分析

该文通过Python进行信贷数据的业务分析,包括每个季度的账单金额、坏账率、60天和90天入催率,以及不同逾期天数的回款情况。结果显示,2018Q2前资金审核严格,坏账率和入催率较低,Q3后策略调整,虽上升但仍保持在3%以内。逾期30天内的账单回收效果较好。
摘要由CSDN通过智能技术生成

1、项目背景

对信贷数据进行业务数据分析,并且分析出以下内容:

  • 每个季度账单金额和坏账率(逾期90天以上);
    坏账率 = (账单金额-实收金额)/所有账单金额
  • 每个季度60天账期入催率,90天账单 入催率;
  • 不同逾期天数的回款情况
    分为历史逾期和当前逾期,其中历史逾期表示之前逾期但现在已经还完了,当前逾期表示现在欠钱并没有还完。

2、代码实现

2.1 导入包和数据

# 导入包和数据
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns

df = pd.read_excel('业务数据.xls')
df_copy = df.copy()
df.head()

在这里插入图片描述

df_copy.info()

在这里插入图片描述
以上数据信息可以看出,关键数据存在一定的缺失,需要根据实际情况进行填充,而日期数据需要转化为日期格式。

df_copy.describe()

在这里插入图片描述

2.2 数据处理

对缺失数据进行填充,对时间数据进行日期转化。

# 到账日期采用实际到账日最大的日期
today_time = pd.to_datetime(df_copy['实际到账日'].fillna(0)).max()
df_copy['实际到账日'] = pd.to_datetime(df_copy['实际到账日']).fillna(today_time)
df_copy['账单周期'] = pd.to_datetime(df_copy['账单周期'])
df_copy['应付日期'] = pd.to_datetime(df_copy['应付日期'])

df_copy['开票金额'] = df_copy['开票金额'].fillna(0)
df_copy['实收金额'] = df_copy['实收金额'].fillna(0)
df_copy['未收金额'] = df_copy['未收金额'].fillna(0)
df_copy.head()

在这里插入图片描述
添加新的特征项

# 为了后续计算,在原始数据基础上构造新的字段:是否逾期,是否逾期90天,未收金额2(校验原始数据中的未收金额),当前逾期天数,历史逾期天数
df_copy['未收金额2'] = df_copy['账单金额'] - df_copy['实收金额']
df_copy['是否逾期'] = df_copy.apply(lambda x: 1 if today_time>x.应付日期 else 0, axis=1)
df_copy['是否逾期90天'] = (today_time-df_copy.应付日期).map(lambda x:1 if x.days>=
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

AIGC人工智残

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值