本专栏文章会在本博客和知乎专栏——Sunny.Xia的深度学习同步更新,对于评论博主若未能够及时回复的,可以知乎私信。未经本人允许,请勿转载,谢谢。
一、什么是MMOE?
三张图分别是多任务模型的不同结构,具体介绍可以参见多任务学习之MMOE模型,该文章里也提供了一个简单的demo助于读者了解,很详细就不过多赘述了。
论文地址:https://github.com/ruozhichen/deep_learning_papers/tree/master/pctr
模型(c)即是本文所要介绍的MMOE模型,图中的三个Expert可以理解为相互独立的三个子网络,Tower A和Tower B即为两个任务。三个Expert的结果会通过加权和作为Tower的输入,而权重则是由Gate来提供。相比图(b)区别就在于,这里每个任务都有自己的Gate,输出各个Expert的权重大小。整个模型表达式如下所示: