多目标建模loss为什么最好同时收敛？

最新推荐文章于 2024-08-22 17:27:46 发布

winner8881

最新推荐文章于 2024-08-22 17:27:46 发布

阅读量685

点赞数

文章标签：算法 python 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_22866291/article/details/131113236

版权

多目标的多个loss是否同时收敛最好？

假设

task A的独有参数 $W_a$
task B的独有参数 $W_b$
task A和 task B的共享的参数 $W_s$

那么
$loss = loss_a + loss_b$
假设损失函数为 $f$ ，带入参数 $W_a$ 、 $W_b$ 、 $W_s$ ，则有
$loss= f_{loss_a}(W_A, W_B, W_S) + f_{loss_b}(W_A, W_B, W_S)$
当A先收敛后，A的loss $f_{loss_a}$ 应该最小，对Task A而言，此时的 $W_a$ 、 $W_b$ 、 $W_s$ 是最优的。但是此时B还没有收敛，B在继续走向收敛之路时，在loss的驱动下，候会使得刚才对于Task A最优的 $W_a$ 、 $W_b$ 、 $W_s$ 发生变化，也就是会导致A的loss又不是最优的了。

结论

如果收敛速度不一样，收敛慢的task会对收敛快的task产生一个梯度的拉扯，导致已经收敛的task被迫再次回到为收敛的状态。（所谓梯度冲突、参数撕扯）

最好的情况是什么？

最优最好的做法就是，一起收敛。如何一起收敛呢？当然是用多目标loss的优化方法了

多目标loss优化的方法

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
多目标建模loss为什么最好同时收敛？

多目标的多个task如果收敛速度不一样，收敛慢的task会对收敛快的task产生一个梯度的拉扯，导致已经收敛的task被迫再次回到为收敛的状态，本文给出了原因和解决办法。
复制链接

扫一扫

winner8881 CSDN认证博客专家 CSDN认证企业博客

码龄10年

159: 原创

5万+: 周排名

2万+: 总排名

12万+: 访问

: 等级

2012: 积分

93: 粉丝

79: 获赞

54: 评论

324: 收藏

私信

关注

热门文章

分类专栏

召回 1篇
工具 6篇
推荐系统 14篇
Java 1篇
微服务 1篇
运维 25篇
大数据 16篇
sql 7篇
机器学习 31篇
数据挖掘 21篇
硬件电路 4篇
数据结构 20篇

最新评论

声源级、接收电压灵敏度(接收带内响应)
weixin_45952490: 做换能器的大神吗，都是
强化学习 Q-learning 算法举例
winner8881: 注意，1号和4号都可以走出房间，是把外面的所有部分都当成了房间5，所以4不仅可以转移到0,3，也可以转移到5
一文搞懂 AB Testing 的分层分流
winner8881: 如何保证精排不受到重排的影响？这是一个挖坑的问题，因为精排和重排是流量分层且正交的，当然不会收到影响，一般来说，分层从上到下依次是：召回层、精排层、重排层。
DeepFM梳理
winner8881: FM 用隐向量的方式不需要特征共线都可以训练，提高了泛化能力，可以让没有同时出现的特征学好。
Attention中的Q、K、V
winner8881: 2、Q、K、V attention是transformer的核心所在。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。