【采访】腾讯社交广告高校算法大赛第一周周冠军——郭达雅 比赛经验及心得分享
经过一周紧张又激烈的角逐
腾讯社交广告高校算法大赛产生了第一位周冠军
他的名字叫郭达雅
一个腼腆沉静的小男孩
低调的实力派,祝贺你
小编对咱们的周冠军同学进行了短暂的采访
于是就有了下面这篇分享
…
周冠军 郭达雅
大家好,本人郭达雅。现就读于中山大学数据科学与计算机学院,是一名计算机科学与技术的大三学生。今天很荣幸有个机会来分享一下比赛经验及心得。
刚接触这类比赛是在今年的三月份,当时刚好有个课程需要我们做kaggle的Two-sigma Connect,以排名作为成绩,经过两个月的努力,最终拿了 top 2%,同时也让我喜欢上了这种比赛。有了两个月的比赛经验,让我在这次腾讯社交广告高校算法大赛中,险拿了一次周冠军。
接下来主要讲下我在这个比赛中的一些想法及做题思路。
1、线上及线下的一致
可能大家对线上和线下不太了解,我这里做一下解释。线下成绩指的是你在本地跑的成绩,一般是做交叉验证 (CV) ,由于这个比赛具有时序性,可能会按时间划分训练集。而线上成绩便是你提交上去的成绩。
对于这种比赛,首先你必须做到CV和线上的成绩相差不大,其次 CV 和线上的成绩应该是同增同减的。否则后面你所做的事情都是白费功夫,因为 CV 根本体现不出来特征的好坏。为了同步 CV 和线上成绩,我花了两天的时间去做这件事情。
2、缩减训练时间
这次的比赛,大家比较在意的一件事就是自己电脑不够好,跑不动。但其实有很多方法可以解决这个问题的,比如缩小数据集,使用百分之一的数据量进行训练,又或者优