参加的这次kaggle比赛是一个关于客户购买预测的机器学习的比赛,最终Public和Private榜综合计算后名次是458/8800,这也是第一个完成度最高的比赛,以往天池的比赛都是跟进几天就不再做了。亲自看着从参加此比赛时的几百个队伍到最终的9000多个队伍,官方清理和结算一些违规和小号之后最终队伍数是8800个,很可惜的是440名以前就可以拿到银牌,但还是差了一些名次,因为是solo也没人一起玩,所以这个比赛成绩还是挺满意的。
同学之前也经常交流机器学习应该怎么学,我觉得最好的方式就是边打比赛边学习,kaggle(目前数据竞赛最好的平台之一)和天池(国内最好的数据竞赛平台之一,由阿里巴巴负责)里有很多人会分享经验,这些对于快速入门是非常有帮助的。如果没有这些比赛,我对机器学习的模型了解还停留在SVM、决策树、贝叶斯、逻辑回归等传统的模型中(也不是说这些模型不好,也见过别人用传统的贝叶斯,成绩也非常好),但是经过这些比赛,知道了很多数据处理与特征提取的方法,也对目前的比赛常用模型有了一定的了解。目前机器学习比赛也可以说是特征工程大战(相比深度学习比赛主要是模型上的一些改进),模型上大家上来基本都会用Random Forest(bagging的集成学习)、XGBOOST、LightGBM、Catboost(boost的集成学习),关于bagging与boost集成学习的区别,在之前的博客中有提及。
我的第一个kaggle铜牌经历
最新推荐文章于 2024-09-01 09:57:52 发布