目标
预测用户贷款是否违约,提交每个测试样本=1的概率;
评估指标
指标:AUC(越大越好);
数据
数据概况
来源:某信贷平台的贷款记录;
数据量:超过120w,80w条训练集,20w条测试集A,20w条测试集B;
字段:47列变量,其中15列为匿名变量;
其他:employmentTitle、purpose、postCode和title等信息脱敏;
字段
id 为贷款清单分配的唯一信用证标识
loanAmnt 贷款金额
term 贷款期限(year)
interestRate 贷款利率
installment 分期付款金额
grade 贷款等级
subGrade 贷款等级之子级
employmentTitle 就业职称
employmentLength 就业年限(年)
homeOwnership 借款人在登记时提供的房屋所有权状况
annualIncome 年收入
verificationStatus 验证状态
issueDate 贷款发放的月份
purpose 借款人在贷款申请时的贷款用途类别
postCode 借款人在贷款申请中提供的邮政编码的前3位数字
regionCode 地区编码
dti 债务收入比
delinquency_2years 借款人过去2年信用档案中逾期3