记一次大数据挑战赛

记一次大数据挑战赛

对于给定的一定数量到访过微信视频号“热门推荐”的用户, 根据这些用户在视频号内的历史n天的行为数据,通过算法在测试集上预测出这些用户对于不同视频内容的互动行为(包括点赞、点击头像、收藏、转发等)的发生概率。 本次比赛以多个行为预测结果的加权uAUC值进行评分

2021微信大数据挑战赛

第一次接触这类比赛,成绩不大行,记录一下自己实验到的东西,并不一定对

因为第一次,对于什么特征在这类任务中比较重要也不清楚,造的特征主要参考了大佬的分享微信视频号推荐算法解题思路

nn模型用的是deepctr的deepfm模型,树模型用的lightgbm

  • 对nn尝试过各类采样方法都没有全量训练效果好

  • deepfm的dnn层数[128,128,128]好像就够用了

  • 使用adam比adagrad好

  • deepfm、xdeepfm、autoint效果差不多

  • batchsize尝试中1024结果比较好

  • deepfm中统计特征的作用不大,加上feed embedding后有很大的提升

  • 对tags和keyword使用word2vec好像没有multilable降维后好用

  • user相关的特征比较好用,feed的特征作用不是很明显

  • nn多折融合有明显的提升,融合树模型和nn也有大的提升

  • 没有利用到任务间的相关性,没来的急试试mmoe

想看看大佬是怎么做的,等着大佬分享

数据集下载

链接: https://pan.baidu.com/s/1SPmyv7zoHhDVm57N0OgUzA

提取码: 8g95

代码地址

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值