赛题背景
很多人在申请贷款时都会因为缺少或没有信用历史而遇到困难。而且不幸的是,这部分人常常会去使用靠不住的出借人。
HomeCredit努力通过提供正面、安全的借款历史,来扩展这部分无银行账户人群的金融包容性。
为了确认这个没得到周到服务的人群有正面信贷经历,HomeCredit使用了很多可选的数据,包括电信和交易信息,来预测他们客户的偿还能力。
当HomeCredit最近使用不同的统计和机器学习方法来做这些预测,他们向kaggler 的参赛者发起挑战,让他们来帮他们解锁数据中的所有潜在信息。这么做会确保有偿还能力的客户不被拒绝,并且贷款是用本金、到期日、还款日程提供的,这会帮他们的客户取得成功。
评价方法
提交结果会用预测概率和观测目标的ROC曲线下的面积(AUC,Area Under Curve)来评估。
- 提交文件
对测试集中的每个SK_ID_CURR,必须预测出目标的概率。文件需要包括标题,并按如下格式提供:
SK_ID_CURR,TARGET
100001,0.1
100005,0.9
100013,0.2
etc.