违约风险相关比赛的建议

关于类似比赛的有意思讨论还有很多,大家有时间可以阅读下Home Credit Default Risk比赛中第一名Silogram的帖子:

https://www.kaggle.com/c/home-credit-default-risk/discussion/58332

  1. 由于我们为每个申请人提供了历史数据,因此这在一定程度上是一个时序问题。这意味着最新数据比旧数据更相关。
  2. 人们的信用问题有很多随机性,这意味着每折数据之间存在很多差异。尝试不同的K折实验设置,以查看您的模型是否稳定,并且通过更多fold拟合LB分数,我们可以将LB的数据想象成更多的1折数据。有时候可能会出现一个离群值,所以TRUST YOUR LOCAL CV!!!
  3. 关于数据的一个奇怪之处是,有时候初赛与复赛会给我们提供不同的数据,我们可能不知道为什么会这样,但是研究这些差异可能会带您一些有用的特征。
  4. 与所有Kaggle竞赛(以及所有机器学习问题)一样,最重要的第一步是获取与测试集匹配的验证集设置。在线下验证值得信赖之前,花时间进行特征设计是没有意义的。这个比较好理解,也是大家经常遇到的一个问题就是“线下分数涨了为什么线上分数没有涨?”,所以我们可以尽可能找到一份可靠的验证集以及评估方法,尽量保证线下线上分数趋势变化一致。
  5. 从业务的角度来看,我们生成的所有有用功能都很有意义。考虑什么情况会导致信用问题并基于这些思想衍生特征。很多特征中的大多数可能不会起作用,但是不要轻易放弃。数据集非常丰富,特征生成的可能性几乎是无限的。
  6. 享受比赛!有很多比赛违约容易摸奖,容易翻车,尽力而为,剩下交给运气。比如这样:在这里插入图片描述

最后欢迎大家关注我们的公众号:ChallengeHub,加入ChallengeHub粉丝群,共同探讨,共同学习,共同进步!!!
在这里插入图片描述
在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值