MMOE多目标学习

最新推荐文章于 2025-05-11 19:52:07 发布

CatTravel

最新推荐文章于 2025-05-11 19:52:07 发布

阅读量1k

点赞数 4

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签：机器学习深度学习人工智能神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/CatTravel/article/details/112133662

本文探讨了MMOE（Multi-gate Mixture-of-Experts）在多目标学习中的应用，解释了其在网络结构上的优化如何解决不同目标差异化问题。通过MMOE模型，可以在多个业务目标中实现更好的性能，尤其是在正样本稀疏的情况下。论文和实际场景优化展示了MMOE在处理大规模实时数据时的有效性，如使用不同网络结构的expert和引入公用与私有expert机制。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

（致力结合理论知识与互联网前沿应用场景，给读者全方位的收获）

摘要：

最近多目标模型越来越受到重视，特别在工业界有很好的应用。本文通过讲解MMOE的原理，并根据笔者在工作中应用MMOE的经验，来给大家引出这篇博文。

多目标模型的意义：

现实世界中，我们的业务目标往往不是单一的。
比如购物APP中，我们不仅仅希望你浏览商品，也希望你购买商品，甚至分享商品，评论商品。
比如短视频推荐，我们不单希望你看视频，也希望你点赞、评论、分享视频，还希望你能关注发布的作者。
因此多目标模型的出现，就可以让我们的场景同时服务到这些目标。于此同时，对于一些正样本稀疏的目标，多目标模型甚至可以让他们的目标实现远超预期。

为什么要使用MMOE实现多目标：

1、MMOE通过特殊的模型结构达到了一个模型实现多个目标的能力
2、MMOE通过模型结构的优化使各项目标都很好的实现
3、MMOE可以通过网络共享帮助正样本稀疏的目标更好地达成

论文标题和链接：

论文地址先供上，想硬撸原文的同学请享用：
标题：Modeling Task Relationships in Multi-task Learning with Multi-gate Mixture-of-Experts
链接：https://dl.acm.org/doi/10.1145/3219819.3220007

MMOE网络结构

在这里插入图片描述

MMOE的网络结构衍化图，衍化的过程是为了更好地解决多目标问题。图( a ) 到

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。