金融风控数据挖掘-Task6

最新推荐文章于 2023-02-04 18:27:07 发布

Captainphiora

最新推荐文章于 2023-02-04 18:27:07 发布

阅读量176

点赞数

分类专栏：金融风控

本文链接：https://blog.csdn.net/Captainphiora/article/details/116430867

版权

金融风控专栏收录该内容

5 篇文章 1 订阅

订阅专栏

本文详述了一次金融风控数据挖掘比赛的经历，重点讨论了在task3中使用贝叶斯调参解决难题的过程，以及lgb模型的构建。尽管时间紧迫，仅完成了lgb和部分xgb模型，通过简单加权融合得出最终结果。作者反思了比赛中追求小数点排名的现象，并指出该比赛难度适中，适合新手入门。

摘要由CSDN通过智能技术生成

一、学习知识点概要

本文为金融风控数据竞赛的最后一part，在不少的努力下提交了最终的结果，虽然排名不尽人意，但总归是努力的结果。

二、学习内容

1、部分难题

印象最深刻的是task3中的调参过程，所使用的调参方式为贝叶斯调参。
贝叶斯调参代码块
可以看到单是调参过程就花了大概80分钟，而后通过调整一个较小的学习率，使用cv函数确定最优的迭代次数。
确定迭代次数
中间过程前面已经提及，最终lgb的单模型ROC曲线如下。
lgb单模型ROC曲线

2、比赛结果

理论上来说可以通过调lgb，xgb，cat的参数，找最优迭代次数等方法求出不同的test值，再用不同的模型融合方法（stacking，blending，甚至加权）对三种树模型进行融合，然后就是刷分的过程了，大概是这样，但此次由于时间问题，只完整做出了lgb以及部分的xgb模型，然后通过简单的加权得到了最终的结果。
最终结果

三、学习问题与解答

1、小数点的意义

第一次参加这种数据挖掘比赛，赛前其实一直都有一个问题，类似kaggle这种比赛，选手们多半有一个特殊的爱好，那就是刷排名，通过不断提交新结果，在小数点上做文章，不可否认，一个好的排名能从一定意义上体现一个选手的能力，或者说一个团队的能力，但是，如果在赛后对于这个比赛过程没有一个好的总结，可能有点索然无味的感觉。

四、学习思考与总结

赛前就看到了官方对于此次比赛的难度定义为中，整个过程下来也发现其实难度介于低到中之间，当然如果要研究透不同模型，模型融合等难题那就不止这个难度了，此次比赛，lgb的单模型就可以得到一个不错的分数，显然相当照顾新手，这也是为什么说比赛的完成、结果的提交难度介于低到中之间。

Captainphiora

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
金融风控数据挖掘-Task6

金融风控数据挖掘-Task6一、学习知识点概要二、学习内容1、部分难题2、比赛结果三、学习问题与解答1、小数点的意义四、学习思考与总结一、学习知识点概要本文金融风控数据竞赛的最后一part，在不少的努力下提交了最终的结果，虽然排名不尽如人意，但总归是努力的结果。二、学习内容1、部分难题印象最深刻的是task3中的调参过程，所使用的调参方式为贝叶斯调参。可以看到单是调参过程就花了大概80分钟，而后通过调整一个较小的学习率，使用cv函数确定最优的迭代次数。中间过程前面已经提及，最终lgb的单模
复制链接

扫一扫