[新浪微博互动预测大赛]来自内部赛冠军的问候,教你破40啦!

本文分享了在新浪微博互动预测大赛中,理解并优化训练目标的重要性。指出仅追求预测准确率会导致低分,建议将预测值分档或将评分目标作为最终目标,以提高整体得分。同时提到了NLP特征在宏观和微观层面的应用,以增强预测效果。
摘要由CSDN通过智能技术生成
天池微博大赛攻略进阶
分享者:新浪微博互动预测大赛冠军  紫净
 


一.训练目标
本次比赛制胜的最关键点就是搞清楚训练目标。如果使用XLAB或其它算法包上的已有算法,一般的大致思路是这样的:构造各种特征,使用GBDT,RF等分别预测每条微博的转发,评论与点赞数量,然后作为答案。但很遗憾,如果你预测的是连续值,XLAB或其它算法包里面的模型的默认学习目标是准确率最高,每一条微博的权重都是一样的,那么预测的答案最终肯定会要么都是0,要么都很接近0。
而本题的评分公式中,每一条微博都有一个权重(转发数+评论数+点赞数+1),显然本题中的得分最高,与转发,评论,点赞预测结果的准确率最高是两个差距很大的目标。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值