天池微博大赛攻略进阶
分享者:新浪微博互动预测大赛冠军 紫净
一.训练目标
本次比赛制胜的最关键点就是搞清楚训练目标。如果使用XLAB或其它算法包上的已有算法,一般的大致思路是这样的:构造各种特征,使用GBDT,RF等分别预测每条微博的转发,评论与点赞数量,然后作为答案。但很遗憾,如果你预测的是连续值,XLAB或其它算法包里面的模型的默认学习目标是准确率最高,每一条微博的权重都是一样的,那么预测的答案最终肯定会要么都是0,要么都很接近0。
而本题的评分公式中,每一条微博都有一个权重(转发数+评论数+点赞数+1),显然本题中的得分最高,与转发,评论,点赞预测结果的准确率最高是两个差距很大的目标。