赛题理解: 阿里天池 零基础入门金融风控-贷款违约预测


本次赛题链接:https://tianchi.aliyun.com/competition/entrance/531830/information

题意理解

  • 这道题的目的是预测用户是否违约,本质上就是一个二分类问题。
  • 每个样本有 47 个特征,其中 15 个特征做了匿名化处理,不同的特征具有不同的性质!如id是离散的,且没有顺序以及大小的关系;grade表示贷款等级虽然同样是离散的,但他是有大小之分的,因此在建模之前应当尽量考虑这些关系~
  • 数据的样本数量超过120完,其中使用20万作为测试集、20万作为验证集,因此训练集的数据量是超过80万的,数据的数量应当还是很充足。

提交与指标

  • 最终结果使用AUC作为评价指标,AUC越大越好
  • 提交的是当前样本是违规的概率,而不是某个类别

需要注意的地方

  • 首先需要做数据分析,了解数据的分布情况,比如:
    • 是否有缺失值,如果有,该如何处理
    • 类别是否均衡
    • 变量相关性分析等
  • 模型的选择
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值