推荐系统遇上深度学习(九十二)-[腾讯]RecSys2020最佳长论文-多任务学习模型PLE

最新推荐文章于 2024-08-11 20:38:43 发布

文文学霸

最新推荐文章于 2024-08-11 20:38:43 发布

阅读量6.6k

点赞数 6

文章标签：算法神经网络机器学习人工智能深度学习

本文链接：https://blog.csdn.net/abcdefg90876/article/details/108898482

版权

本文介绍了腾讯在RecSys2020的最佳长论文，探讨了多任务学习（MTL）在推荐系统中的应用，特别是为了解决负迁移和跷跷板现象提出的新模型Progressive Layered Extraction（PLE）。PLE通过多层信息提取和自定义门控控制，提高了任务间的协同学习效果，实验表明PLE在多个任务上都优于传统MTL模型。

摘要由CSDN通过智能技术生成

今天介绍的是腾讯提出的一种新的多任务学习个性化推荐模型，该论文荣获了RecSys2020最佳长论文奖，一起来学习下！

1、背景

多任务学习通过在一个模型中同时学习多个不同的目标，如CTR和CVR，最近被越来越多的应用到线上的推荐系统中。

当不同的学习任务之间较为相关时，多任务学习可以通过任务之间的信息共享，来提升学习的效率。但通常情况下，任务之间的相关性并不强，有时候甚至是有冲突的，此时应用多任务学习可能带来负迁移（negative transfer）现象，也就是说，相关性不强的任务之间的信息共享，会影响网络的表现。

此前已经有部分研究来减轻负迁移现象，如谷歌提出的MMoE模型。该模型会在第二节进行一定的回顾。但通过实验发现，多任务学习中往往还存在seesaw phenomenon（本文中暂且翻译为跷跷板现象，如有不当，欢迎指正），也就是说，多任务学习相对于多个单任务学习的模型，往往能够提升一部分任务的效果，同时牺牲另外部分任务的效果。即使通过MMoE这种方式减轻负迁移现象，跷跷板现象仍然是广泛存在的。

论文提出了Progressive Layered Extraction (简称PLE)，来解决多任务学习的跷跷板现象。本文会在后面对PLE进行详细介绍。

本文的后续首先将介绍一下多任务学习的一些常见的架构，然后重点介绍论文提出的PLE，最后简单介绍一下实验结果部分。