作者:花花_Angel
R语言爱好者,R语言中文社区原创作者
一、项目背景
本项目使用R语言对银行的个人金融业务数据进行分析,以对个人贷款是否违约进行预测。帮助业务部门及时发现问题,以避免损失。
二、数据说明
本项目数据集来自《数据科学实战:Python篇》。数据集包含8个表:账户表accounts、信用卡表card、客户信息表clients、权限分配表disp、人口地区统计表district、贷款表loans、支付订单表order、交易表trans。此数据集数据较为丰富,通过分析这份数据可以获取与银行服务相关的业务知识。
账户表(Accounts):4500条记录
信用卡表(card):892条记录
顾客信息表(clients):5369条记录
权限分配表(Disp):5369条记录
地区表(district):77条记录
贷款表(loans):682条记录
订单表(order):6471条记录
交易表(trans):1056320条记录
各表间关系详见关系实体图(E-R图):