天池二手车比赛
Ivan_禧
这个作者很懒,什么都没留下…
展开
-
天池&Datawhale二手车新手赛Task05
天池&Datawhale二手车新手赛Task05模型融合尝试不同的融合方式融合模型的解释模型融合模型融合, 虽然远离并不难理解, 比如随机森林, XGBoost 这种, 某种意义上也是一种模型的融合, 随机森林用的是不同学习器投票的方式, 而XGBoost这类则用的是弱学习器叠加的方式. 前者是民主集中制, 少数服从多数, 后者则是三个臭皮匠赛过诸葛亮的方式. 但这些都是把模型融合整...原创 2020-04-04 20:49:23 · 214 阅读 · 0 评论 -
天池&Datawhale二手车新手赛-Task03
如何做特征工程首先确定你选用的模型是什么特征工程应当结合模型来做,这看起来似乎是一句废话,但与一些参赛的小伙伴讨论过后,发现很多人都没有认识到这一点。或者说只是表面上知道这一点,却并没有很好地在建模中践行。我觉得这里有一个原因,就是很多同学在做data mining的时候,只是调包,然后顶多调一下超参数,只能从结果来判断参数好坏,并不知道为什么好,甚至连有哪些超参数都不清楚。基于此,对特征工程...原创 2020-03-28 21:37:08 · 177 阅读 · 0 评论 -
天池&Datawhale二手车新手赛-Task02
这一阶段主要是熟悉数据,并进行初步的EDA,个人认为EDA应该是一直持续到比赛前三天左右时间吧,最后就应该全力调参以及尝试各种trick了。这一阶段,我觉得pandas_profiling 这个包能够很好的解决冷启动问题,看完基础报告下来,特征的一些基本情况也都大致了解了。唉,果然一本正经的按部就班写不适合我的特点,直接进入吐槽模式吧。对Y进行正态性转换的思考首先是data whale给的...原创 2020-03-24 20:40:49 · 214 阅读 · 1 评论