总体介绍
Home Credit Default Risk是Home Credit公司在kaggle上的一个信贷风险评估竞赛。其提供的数据文件描述及文件间关联关系如下:
有些金融专有名词尤其是一些公司产品的专有名词对于我们外行人员来说相当难理解了,所以我查看了下公司官网,给出了一些背景介绍,有助于理解数据吧。
Home Credit公司的商业模式其实跟支付宝的某些部分很像,后面会类比。一个信用贷款公司的为一个在本公司没有信用记录的用户提供信用贷款是有很大风险的,当然一般冷启动的做法可以是查询用户在信用局的历史征信记录来作为风险评估的参考,数据文件中的bureau.csv和 bureau_balance.csv 就对应这部分数据
此外信用贷款公司还需要逐步引导用户使用自己公司的金融产品,来建立自己的信用体系。Home Credit公司的产品也是循序渐进的,其中Point-of-sale (POS) loans就是一款入门级产品,对于一些价值不高的零售业商品(预计普通人都能承受起的商品),引导用户通过该产品分期付款,从而建立初步的信用数据,这么说起来就很像我们常用的支付宝的花呗功能了,POS_CASH_balance.csv 中的数据就来源于此。该产品体系图如下:
在此基础上衍生出的进阶产品就有Credit cards,可以理解为信用贷款吧,类似于支付宝的借呗 功能,用户使用该产品产生的信用记录就对应于credit_card_balance.csv 中的数据。