Learning to Generalize:Meta-Learning for Domain Geralization 深度理解（公式详细推导，包含二阶导）

dailleson_

已于 2024-01-09 16:04:20 修改

阅读量2.2k

点赞数 8

分类专栏：迁移学习文章标签：线性代数机器学习深度学习算法 pytorch

于 2020-09-21 10:03:53 首次发布

本文链接：https://blog.csdn.net/dailleson/article/details/108703140

版权

迁移学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

1.算法整体流程

输入：训练域为: $S$

初始化：模型参数 $\theta$ ,学习率： $\beta,\gamma$

for ite in iterations do

Split: $\bar{S}$ and $\check{S}$ $\rightarrow$ $S$

Meta-train:

Gradients $\nabla_{\theta_1}=\mathcal{F^{'}_\theta}(\bar{S};\theta)$

Updated parameters $\theta^{'}=\theta-\beta\nabla_{\theta_1}$

Meta-test:

Loss is $\mathcal{G}(\check{S};\theta^{'})$

Gradients Update $\theta:$
$\nabla_{\theta_2}=\frac{d\mathcal{G}(\check{S};\theta^{'})}{d\theta}=\frac{d\mathcal{G}(\check{S};\theta-\beta\nabla_{\theta_1})}{d\theta^{'}}\frac{d\theta^{'}}{d\theta}=\mathcal{G^{'}_{\theta^{'}}}(\check{S};\theta-\beta\nabla_{\theta_1})\frac{d(\theta-\beta\nabla_{\theta_1})}{d\theta}=\mathcal{G^{'}_{\theta^{'}}}(\check{S};\theta-\beta\nabla_{\theta_1})(1-\beta\frac{d\nabla_{\theta_1}}{d\theta})$

Meta-optimization: Update $\theta:{\color{Red}csdn在线markdnow的latex不支持begin\{align\}标签，贴图如下}$
在这里插入图片描述

2.总结

MLDG是第一篇将meta learning引入domain generalization的论文。在这篇论文中， $\mathcal{G}(;)=\mathcal{F}(;)=CrossEntropy$ ，二阶导几乎不起作用，训练模型的时候可以将代码中二阶导计算关掉(没用还很耗时)。

loss.backward(retain_graph=True, create_graph=True)
->改为
loss.backward(retain_graph=True, create_graph=False)

楼主跑过这篇文章的代码，性能与普通训练方式差不太多，即先在 $\bar{S}$ 训练更新，然后再在 $\check{S}$ 上训练更新。个人认为他的insight在于启发了后续的meta-dg方法，后续方法重新设计能够约束特征空间的 $\mathcal{G}(;)$ ，后续方法是否有效等楼主验证后再更新。

dailleson_

关注

8
点赞
踩
9

收藏

觉得还不错? 一键收藏
10
评论
Learning to Generalize:Meta-Learning for Domain Geralization 深度理解（公式详细推导，包含二阶导）

1.算法整体流程输入：训练域为: SSS初始化：模型参数θ\thetaθ,学习率：β,γ\beta,\gammaβ,γfor ite in iterations do Split:Sˉ\bar{S}Sˉ and Sˇ\check{S}Sˇ →\rightarrow→ SSS Meta-train: Gradients ∇θ1=Fθ′(Sˉ;θ)\nabla_{\theta_1}=\mathcal{F^{'}_\theta}(\bar{S};\theta)∇θ1=Fθ′(Sˉ;θ)
复制链接

扫一扫