【论文】Multi-Task Learning Using Uncertainty to Weigh Losses for Scene Geometry and Semantics

最新推荐文章于 2023-05-09 10:07:56 发布

so_so_y

最新推荐文章于 2023-05-09 10:07:56 发布

阅读量1.3k

点赞数 3

分类专栏：论文文章标签： pytorch 神经网络深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/so_so_y/article/details/105302233

版权

论文专栏收录该内容

10 篇文章 0 订阅

订阅专栏

本文提出了一种多任务loss权重学习的方式，通过训练协调了三个任务的loss，有语义分割、实力分割和depth regression，结构主要是：
在这里插入图片描述

文中主要分为了三种情况来介绍：

回归任务

定义一个概率分布函数，假设其符合高斯分布，令 $f^W(x)$ 为输入为x、权重为W的网络的输出，并将 $f^W(x)$ 看作均值 $\mu$ ，则有：
$p(y|f^W(x))=N(f^W(x),\sigma^2)$
取log可得：
$\begin{aligned} logp(y|f^W(x)) &=-\frac{1}{2\sigma^2}||y-f^W(x)||^2-log\sqrt{2\pi}\sigma\\ &∝-\frac{1}{2\sigma^2}||y-f^W(x)||^2-log\sigma \end{aligned}$
当有两个输出 $y_1$ 和 $y_2$ 时：
$\begin{aligned} p(y_1,y_2|f^W(x))&=p(y_1|f^W(x))\cdot p(y_2|f^W(x))\\ &=N(y_1;f^W(x),\sigma_1^2)\cdot N(y_2;f^W(x),\sigma_2^2) \end{aligned}$
则定义：
$\begin{aligned} L(W,\sigma_1,\sigma_2)&=-logp(y_1,y_2|f^W(x))\\& ∝\frac{1}{2\sigma_1^2}||y_1-f^W(x)||^2+\frac{1}{2\sigma_2^2}||y_2-f^W(x)||^2+log\sigma_1\sigma_2\\&=\frac{1}{2\sigma_1^2}L_1(W)+\frac{1}{2\sigma_2^2}L_2(W)+log\sigma_1\sigma_2，\\&L_1(W)=||y_1-f^W(x)||^2,L_2(W)=||y_2-f^W(x)||^2 \end{aligned}$
分类任务

定义概率分布函数：
$P(y|f^W(x),\sigma)=Softmax(\frac{1}{\sigma^2}f^W(x))$
考虑到 $Softmax(x)=\frac{exp(x_i)}{\sum_i exp(x_i)}$ ，则log似然函数可化简为：
$\begin{aligned}&logp(y=c|f^W(x),\sigma)=\frac{1}{\sigma^2}f_c^W(x)-log\sum_{c'}exp(\frac{1}{\sigma^2}f_{c'}^W(x))，\\&其中，f_{c’}^W(x)是f_c^W(x)向量的第c个元素.\end{aligned}$
接下来，取log，定义新的Loss：
$L(W,\sigma)=-logp(y=c|f^W(x),\sigma)$

令 $L_1(W)=-log Softmax(y,f^W(x))$ ，即y的cross entropy loss.那么上式可继续化简：
$\begin{aligned} L(W,\sigma)&=-logp(y=c|f^W(x),\sigma)\\ &=-logp(y=c|f^W(x),\sigma)+\frac{1}{\sigma^2} L_1(W)-\frac{1}{\sigma^2} L_1(W)\\ &=\frac{1}{\sigma^2} L_1(W)-logp(y=c|f^W(x),\sigma)-\frac{1}{\sigma^2} L_1(W)\\ &=\frac{1}{\sigma^2} L_1(W)-\frac{1}{\sigma^2}f_c^W(x)+log\sum_{c'}exp(\frac{1}{\sigma^2}f_{c'}^W(x))+\frac{1}{\sigma^2}log Softmax(y=c,f^W(x))\\ &=\frac{1}{\sigma^2} L_1(W)-\frac{1}{\sigma^2}f_c^W(x)+log\sum_{c'}exp(\frac{1}{\sigma^2}f_{c'}^W(x))+\frac{1}{\sigma^2}[f_c^W(x)-log\sum_{c'}exp(f_{c'}^W(x))]\\ &=\frac{1}{\sigma^2} L_1(W)+log{\frac{\sum_{c'}exp(\frac{1}{\sigma^2}f_{c'}^W(x)}{[\sum_{c'}exp(f_{c'}^W(x))]^{\frac{1}{\sigma^2}}}} \end{aligned}$
”上方的推导过程加入了个人的理解，如有问题，感谢指出“

当 $\sigma \rightarrow 1$ 时， $\frac{1}{\sigma}\sum_{c'}exp(\frac{1}{\sigma^2}f_{c'}^W(x))\approx[\sum_{c'}exp(f_{c'}^W(x))]^{\frac{1}{\sigma^2}}$ ，则上式可继续化简为：
$\begin{aligned} L(W,\sigma)&=\frac{1}{\sigma^2} L_1(W)+log{\frac{\sum_{c'}exp(\frac{1}{\sigma^2}f_{c'}^W(x)}{[\sum_{c'}exp(f_{c'}^W(x))]^{\frac{1}{\sigma^2}}}}\\ &=\frac{1}{\sigma^2} L_1(W)+log \sigma{\frac{\frac{1}{\sigma}\sum_{c'}exp(\frac{1}{\sigma^2}f_{c'}^W(x)}{[\sum_{c'}exp(f_{c'}^W(x))]^{\frac{1}{\sigma^2}}}}\\ &\approx\frac{1}{\sigma^2} L_1(W)+log\sigma \end{aligned}$
两种类型的混合任务，假设 $y_1$ 是连续输出， $y_2$ 是离散输出

根据1.和2.的推导可得联合Loss $L(W,\sigma_1,\sigma_2)$ 如下图：

其中， $L_1(W)=||y_1-f^W(x)||^2,L_2(W)=-log Softmax(y_2,f^W(x))$ .

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
5
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。