python-个人贷款违约预测模型

本次案例的数据来源为天善智能的课程《数据科学实战-python篇》,把课程认认真真的学习了一遍,看完老师讲的,自己再结合自己的思路,做出来的程序。

一、数据分析目标

通过脱敏过的数据,从贷款表loans、权限分配表disp、客户信息表clients、交易表trans中对数据进行描述性统计,得出对建模有用的数据,建立预测模型,预测正处于贷款期间的人的违约的概率。

二、业务理解

预测,就是在事情发生之前所做的事,案例的事件是贷款,所以,预测模型中所用的数据,应该是贷款的时间点之前的一段时间的情况。是否会违约是Y,贷款之前的一些信息为X。

是否违约,要从两个方面看,能不能还和想不想还。能不能还,就要分析这个人在贷款前的经济状况,是否稳定,还有就是所贷款的金额与自身的收入之间的关系。

经济状况是否稳定,可以看账户余额的均值与方差,求出变异系数,每个人的账户金额都不一样,所以不能用均值来判断,只能用金额的变动系数来判断经济状况的稳定。

所贷款的金额远远高于自己的收入,就有可能最后还不上,所以,需要求出货存比与贷存比来判断。

还得求出收入支出比,有收入才能有钱还贷款。

对于想不想还,就是看这个人的性格了。数据中没有关于这些数据,只有关于借贷人所在地区的基本信息,通过所在地区的犯罪率等信息,来间接判断性格的大概。

对于模型的选择,案例的情况属于分类,所以选择选择分类模型,而案例的这种这种情况,对于预测的结果,是主观进行判断的,可以用逻辑回归。

三、数据整理

数据的还款状态3种情

资源介绍】 基于python实现的银行个贷违约预测源码+项目说明+数据集.zip 该项目是个人毕设项目,答辩评审分达到95分,代码都经过调试测试,确保可以运行!欢迎下载使用,可用于小白学习、进阶。 该资源主要针对计算机、通信、人工智能、自动化等相关专业的学生、老师或从业者下载使用,亦可作为期末课程设计、课程大作业、毕业设计等。 项目整体具有较高的学习借鉴价值!基础能力强的可以在此基础上修改调整,以实现不同的功能。 欢迎下载交流,互相学习,共同进步! 背景 ``` 为进一步促进金融普惠的推广落地,金融机构需要服务许多新的客群。 银行作为对风险控制要求很高的行业,因为缺乏对新客群的了解, 对新的细分客群的风控处理往往成为金融普惠的重要阻碍。如何利用银行现有 信贷行为数据来服务新场景、新客群成了一个很有价值的研究方向, 迁移学习是其中一个重要手段。 ``` 任务描述 ``` 本赛题要求利用已有的与目标客群稍有差异的另一批信贷数据, 辅助目标业务风控模型的创建,两者数据集之间存在大量相同的字段和极少的共同用户。 此处希望大家可以利用迁移学习捕捉不同业务中用户基本信息与违约行为之间的关联, 帮助实现对新业务的用户违约预测。 ``` 数据描述 - 训练数据 - train_public.csv:个人贷款违约记录数据 测试数据 - test_public.csv:测试数据集 评价指标 使用ROC曲线下面积AUC(Area Under Curve)作为评价指标。AUC值越大,预测越准确。
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值