转眼间已经毕业,再过一段时间就要踏上工作的岗位了。
发现有许多朋友问数据集,以及我的代码运行不出来的问题,果然我当时写博客太散漫了- - !
本来想着把以前写的都重新修改一遍,但是我不是很喜欢CSDN的会员积分下载制度(曾经充的会员一年到头都没有用过几次),以后还是简书为主好了。
所以我整理了比赛时写的三篇博文的程序,按照行文逻辑注释了一遍,希望对大家有所帮助。
一、特征工程、stacking的代码
天池- IJCAI-18 阿里妈妈搜索广告转化预测新手入门经历(一:数据预处理、特征工程)
天池- IJCAI-18 阿里妈妈搜索广告转化预测新手入门经历(三:lightgbm调参、ensemble)
以上两篇博客的代码我整合到了一起,需要依次单独运行各模块。其中,比赛的代码分线上和线下,stacking需要用到特征工程处理后的数据,所以接在后面写了。
分享为百度云吧: