1.了解数据
本数据为一家银行的个人金融业务数据集,可以作为银行场景下进行个人客户业务分析和数据挖掘的示例,这份数据中涉及到5300个银行客户的100万笔交易,涉及700份贷款信息,近900张信用卡的数据。通过分析这份数据可以获取相关的业务知识
例如:1.提供增值服务的银行客户经理,希望明确哪些客户有更多的业务需求。
2.风险管理的业务人员可以及早发现贷款的潜在损失,根据客户贷款前的属性、状态信息和交易行为预测其贷款违约行为?
1.1数据字典(表的结构)
1.1.1 Loans 贷款表
名称 | 标签 | Explain |
---|
loan_id | 贷款号 | 主键 |
disp_id | 权限号 | 外键1:对应disp表的主键 |
account_id | 账户号 | 外键2:对应accounts表的主键 |
date | 发放贷款日期 | |
amount | 贷款金额 | |
duration | 贷款期限 | |
payments | 每月归还额 | |
status | 还款状态 | A:合同终止,没有问题;B:合同终止,贷款没有支付;C:合同正在执行中,目前正常;D:合同正在执行中,欠款状态 |
- 根据贷款数据,状态为B和D的账户为违约账户;建立模型时,就可以将status作为变量Y
1.1.2 Accounts 账户表
名称 | 标签 | Explain |
---|
account_id | 账户号 | 主键 |
district_id | 开户分行地区号 | |
date | 开户日期 | |
frequency | 结算频度 | 月,周,交易之后马上 |
1.1.3 Clients 客户表
名称 | 标签 | Explain |
---|
client_id | 客户号 | 主键 |
sex | 性别 | |
birth_date | 出生日期 | |
district_id | 地区号 | 客户所属地区号 |
1.1.4 Disp 权限分配表
- 一条记录描述了客户与账户之间的关系,以及客户操作账户的权限
名称 | 标签 | Explain |
---|
disp_id | 权限号 | 主键 |
client_id | 客户号 | 外键1:对应clients表的主键 |
account_id | 账户号 | 外键2:对应accounts表的主键 |
type | 权限类型 | 身份为‘所有者’才能进行增值业务 |
1.1.5 Orders 支付命令表
名称 | 标签 | Explain |
---|
order_id | 订单号 | 主键 |
account_id | 发起订单的账户号 | 外键1:对应accounts表的主键 |
bank_to | 收款银行 | 每家银行用两个字符表示 |
account_to | 收款客户号 | |
amount | 金额 | |
K_symbol | 支付方式 | |
1.1.6 Trans 交易记录表
名称 | 标签 | Explain |
---|
trans_id | 交易号 | 主键 |
account_id | 发起订单的账户号 | 外键1:对应accounts表的主键 |
date | 交易日期 | |
type | 借贷类型 | |
operation | 交易类型 | |
amount | 金额 | |
balance | 账户余额 | |
K_symbol | 支付方式 | |
bank | 对方银行 | |
account | 对方账户号 | |
1.1.7 Cards 信用卡表
名称 | 标签 | Explain |
---|
card_id | 信用卡号 | 主键 |
disp_id | 账户权限 | 外键1:对应disp表的主键 |
type | 卡类型 | |
issued | 发卡日期 | |
1.1.8 District 人口地区统计表
名称 | 标签 | Explain |
---|
A1 = district_id | 地区号 | 主键 |
GDP | GDP总量 | |
A4 | 居住人口 | |
A10 | 城镇人口比例 | |
A11 | 平均工资 | |
A12 | 1995年失业率 | |
A13 | 1996年失业率 | |
A14 | 1000人中有多少企业家 | |
A15 | 1995年犯罪率(千人) | |
A16 | 1996年犯罪率(千人) | |
1.2 实体-关系(ER图 表的关系)
如需数据:请添加QQ1240929749,备注:csdn数据