Multi-task learning 中的Loss设计

最新推荐文章于 2024-04-17 09:52:24 发布

大师鲁

最新推荐文章于 2024-04-17 09:52:24 发布

阅读量7.4k

点赞数 2

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/laolu1573/article/details/83626555

版权

Multi-task learning 中的Loss设计

在这里插入图片描述

核心问题：

在Multi-task learning的一个核心的问题是loss的设计：
1、如何控制各子任务loss的权重？
2、起始训练时各子任务loss的数量级不同会对收敛造成哪些影响？
这两个问题归结起来是Gradient Balancing(梯度平衡)的问题，不同任务的loss的梯度相差过大，导致梯度小的loss在训练过程中被梯度大的loss所带走。

解决方式：

1.分阶段训练。比如 task A 训练的收敛后，再把 A 和 B join 到一起训练。具体实现上可以看成手动调 loss weight，一开始让 task B 的权重变成一个极小值，比如 10e-6。先训练哪个task，给多少 loss weight，可以根据单各个 task 的收敛曲线来调（预先了解下各个 task 在什么情况下才能收敛到最好）。
2.Grid search。

PS:

Multi-task learning 核心的问题通常是可简单分为两类：
How to share: 这里主要涉及到基于 multi-task learning 的网络设计。
Share how much: 如何平衡多任务的相关性使得每个任务都能有比 single-task training 取得更好的结果。

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
Multi-task learning 中的Loss设计

Multi-task learning 中的Loss设计核心问题：在Multi-task learning的一个核心的问题是loss的设计： 1、如何控制各子任务loss的权重？ 2、起始训练时各子任务loss的数量级不同会对收敛造成哪些影响？这两个问题归结起来是Gradient Balancing(梯度平衡)的问题，不同任务的loss的梯度相差过大，导致梯度小的loss在训练过程...
复制链接

扫一扫

博客等级

码龄13年

97
原创

115
点赞

419
收藏

104
粉丝

关注

私信

热门文章

最新评论

训练过程中常见问题总结
fobiden: 博主，你好，请问我训练的是PSPnet，用的是公用数据集，loss一直下去，但iou就是不提高，你觉得可能的情况是啥，精度也很低，之前没有对公用数据集翻转和旋转预处理的时候，训练精度很高
多模态学习-基于文本和图像信息的商品分类框架
m0_67806730: 博主您好，请问能分享一下数据和代码吗？
多模态学习-基于文本和图像信息的商品分类框架
m0_63218244: 能分享下数据和代码吗？谢谢大佬
LSTM相比一般RNN的优势
城俊BLOG: lstm怎么避免梯度消失啊
多任务学习（Multi-Task Learning, MTL）
yonggeno1: 图床挂了兄弟

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。