基于用户画像的商品推荐挑战赛rank5
科大讯飞这个比赛终于结束了,初赛和复赛我都是在最后几天开始做的,不到deadline不动手,导致后期想试新算法都没有时间了。
最终仅排名第五,略有遗憾!以后还是提早接触好!!!
比赛链接
复赛主要解决方案:
-
数据处理
根据tagid是否缺失把train和test(复赛数据)分出两部分数据集
将复赛数据集的train和test的tagid未缺失用户的tagid序列用来做Word2Vector -
两层GRU
-
test中tagid缺失的用户label直接预测为1
-
线下train_tagidNotnull_F1Score为0.6773461
另外:
- 硬件方面用的自己的一块3060显卡,在batch_size为512的时候,仅有3.6G显存;
- 就算这块显卡再不济,也比我的MacBook Pro计算速度快100倍,比免费版Google colab快30倍。
- 跑一次模型从30min~2h不等,跟embedding size、batch_size、hidden 层数有关。
在接下来的其他比赛中再接再厉把!加油!