Pyspark+tensorflow-信用贷款数据分析实战(一)——了解数据

1.了解数据

本数据为一家银行的个人金融业务数据集,可以作为银行场景下进行个人客户业务分析和数据挖掘的示例,这份数据中涉及到5300个银行客户的100万笔交易,涉及700份贷款信息,近900张信用卡的数据。通过分析这份数据可以获取相关的业务知识

例如:1.提供增值服务的银行客户经理,希望明确哪些客户有更多的业务需求。

​ 2.风险管理的业务人员可以及早发现贷款的潜在损失,根据客户贷款前的属性、状态信息和交易行为预测其贷款违约行为?

1.1数据字典(表的结构)

1.1.1 Loans 贷款表

  • 一条记录代表某个账户上的一条贷款信息
名称标签Explain
loan_id贷款号主键
disp_id权限号外键1:对应disp表的主键
account_id账户号外键2:对应accounts表的主键
date发放贷款日期
amount贷款金额
duration贷款期限
payments每月归还额
status还款状态A:合同终止,没有问题;B:合同终止,贷款没有支付;C:合同正在执行中,目前正常;D:合同正在执行中,欠款状态
  • 根据贷款数据,状态为B和D的账户为违约账户;建立模型时,就可以将status作为变量Y

1.1.2 Accounts 账户表

  • 一条记录描述了一个账户的静态信息
名称标签Explain
account_id账户号主键
district_id开户分行地区号
date开户日期
frequency结算频度月,周,交易之后马上

1.1.3 Clients 客户表

  • 一条记录描述了一个客户的特征信息
名称标签Explain
client_id客户号主键
sex性别
birth_date出生日期
district_id地区号客户所属地区号

1.1.4 Disp 权限分配表

  • 一条记录描述了客户与账户之间的关系,以及客户操作账户的权限
名称标签Explain
disp_id权限号主键
client_id客户号外键1:对应clients表的主键
account_id账户号外键2:对应accounts表的主键
type权限类型身份为‘所有者’才能进行增值业务

1.1.5 Orders 支付命令表

  • 一条记录代表一个支付订单信息
名称标签Explain
order_id订单号主键
account_id发起订单的账户号外键1:对应accounts表的主键
bank_to收款银行每家银行用两个字符表示
account_to收款客户号
amount金额
K_symbol支付方式

1.1.6 Trans 交易记录表

  • 一条记录代表一个账户上的一条交易记录
名称标签Explain
trans_id交易号主键
account_id发起订单的账户号外键1:对应accounts表的主键
date交易日期
type借贷类型
operation交易类型
amount金额
balance账户余额
K_symbol支付方式
bank对方银行
account对方账户号

1.1.7 Cards 信用卡表

  • 一条记录表示一个账户上的信用卡信息
名称标签Explain
card_id信用卡号主键
disp_id账户权限外键1:对应disp表的主键
type卡类型
issued发卡日期

1.1.8 District 人口地区统计表

  • 一条记录描述了一个地区的人口统计学信息
名称标签Explain
A1 = district_id地区号主键
GDPGDP总量
A4居住人口
A10城镇人口比例
A11平均工资
A121995年失业率
A131996年失业率
A141000人中有多少企业家
A151995年犯罪率(千人)
A161996年犯罪率(千人)

1.2 实体-关系(ER图 表的关系)

在这里插入图片描述
如需数据:请添加QQ1240929749,备注:csdn数据

  • 4
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值