银行离岸汇款客户交易预测

银行离岸汇款客户交易预测

这是2018年招商银行最新的Fintech的复试习题,对于初学者而言,个人认为是一个不错的习题。
我在写这篇博客的时候,在这道数据分析题上已经战斗了5天,目前为止虽然得分不高,但是已经取得了阶段性的胜利。
在接下来几天里我回持续公布自己的思路,用到的方法。
希望与有志于数据分析的童鞋们切磋经验,欢迎留言交流!
## 赛题背景

离岸汇款作为境外汇款的重点,通过历史交易信息,提前预测客户未来的交易频度及资金安排,尤其涉及账户行(关联行)的资金头寸调拨,对银行中收及存贷产品销售具有重要指导意义。本次比赛为选手提供脱敏的交易流水数据,希望参赛选手通过分析数据并建模,解决85%的可能下,币种为美元 ( 32 USD ):
1. 未来3个月的汇出汇款(QRTA)与汇入汇款(ISIR)的平均日交易数;

2. 未来3个月的汇出汇款(QRTA)日平均交易额;
3. 结合汇入汇出交易及其他相关交易数据,预测3个月后联机余额排名前20的客户名单。

评价指标


该题目是让参赛者提交概率下的交易数据,由于交易数据是已知的,我们会根据参赛者提交的数据和真实实际的数据进行打分,该题目的打分是根据平均日交易数及交易额通过mae进行评判打分(日平均交易次数及日平均交易额 各占总分值30% ),TOP 20 用户根据预测结果排序与实际结果排序位移方差进行判定,如未能命中TOP 20客户,则记录超过20位移的值,与实际结果方差越小分数越高(占总分值 40%)。有关TOP20的评分法则,可参考TOP-N.py文件。

数据说明


以下为竞赛数据集用于提供训练数据及建模验证。其中:
1. train_dataset.txt 为16年12个月交易数据,以 \t 为分隔符,可用作模型建立的数据训练集使用。
2. 预测及计算结果以UTF-8无BOM编码的txt文件上传,包含以下信息,如下所示:
QRTA xxx

ISIR xxx

TOP20 xxxx
各标题与数据之间用 \t 为间隔符,
TOP20 中的各个客户编号,用 \t 分割开,具体格式如sample.txt所示。
计分规则:
参赛选手提交答案后会获得此次提交答案分数,计分规则是通过对已提交数据的偏差并根据偏差范围域进行评分的。
其中偏差计算逻辑为:
1. 问题1及问题2偏差规则。参赛选手通过提交日均交易数值x,与实际每天发生的交易数值相减后,除以天数n,得到偏差数值。偏差计算公式为 这里写图片描述
2. 问题3显示偏差信息为提交的TOP20结果排名与实际客户排名编号位置的标准差。实际计算python代码
这里写图片描述

偏差越小,分值越高,问题1、2各占30%,问题3占40%


特别提醒
1)数据使用:本赛题数据仅允许用于本次竞赛相关活动,禁止其他用途。
2)外部数据:本赛题仅允许使用“竞赛数据”中提供的数据,不允许使用任何外部数据。
3)数据提交:每日每位参赛选手最多通过系统提交5次的结果,重复提交或提交格式错误均扣除有效提交次数,请谨慎提交答案集。

train.txt

https://pan.baidu.com/s/16FGZaCWgwmDvV4eabTs7gA

sample.txt

https://pan.baidu.com/s/1g-vbG1lQ8psYxe0PvuXfPg

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值