以上为比赛过程的分数历程。线下和线上分数差距太明显了,还没找出原因。qaq
这次比赛,总结来说无非就是数据清洗,特征工程,建立模型,调整参数,模型集成。
数据清洗
主要注重数据的空缺值,异常值以及发现object变量(要在后面转换)。
特征工程
方面首先是理解赛题,理解背景,构建业务特征,以及其他的交互特征,统计量特征,编码特征等等。
模型
模型的话对于数据竞赛也就那几个lgb,xgb集成模型。
阿里云天池金融风控-Task6
最新推荐文章于 2022-07-19 19:57:46 发布