斯坦福教授告诉你：什么是多任务学习「 CS330 笔记 (二) 」

最新推荐文章于 2023-07-25 13:49:03 发布

2018k

最新推荐文章于 2023-07-25 13:49:03 发布

阅读量1.8k

点赞数 6

分类专栏：元学习

本文链接：https://blog.csdn.net/Chen_2018k/article/details/104980383

版权

这篇博客是斯坦福大学CS330课程的笔记，介绍了多任务学习的基础，包括符号说明、任务定义、常见任务类型和基础结构。讨论了条件任务表示、优化目标和面临的挑战，如负面转移和过拟合。笔记还涵盖了实际案例，如视频推荐系统的多任务排名系统。

摘要由CSDN通过智能技术生成

写在前面

本系列博客为斯坦福大学 Stanford CS330： Multi-Task and Meta-Learning 2019 的学习笔记。博客中出现的图片均为课程演示文档的截图。笔记为课程的内容整理，主要是为了方便自己理解和回顾，若有纰漏和错误，烦请指出，谢谢 ~ 。希望对你有帮助。如需转载，请注明出处。
CS330课程传送门

如果你也好奇什么元学习，好奇为什么要学习元学习，可以先搂一眼这篇元学习课程介绍

多任务学习:

模型 & 训练：
模型的类型、基础架构、多任务学习的训练过程
挑战：
处理多任务学习问题中可能遇到的挑战
真实世界多任务学习的案例研究

元学习：

问题陈述(problem formulation)
元学习算法的通用基本框架(general recipe)
黑盒适应方法（Black-box adaptation approaches）

多任务学习基础

符号说明（notation）

在这里插入图片描述

我们用 $\theta$ 来描述网络的参数， $x$ 是网络的输入， $y$ 是网络的输出。即可以把该网络表示成：
$f_{\theta}(y \ |\ x)$

对于单任务有监督学习问题来说，数据集 $\mathcal{D}=\{(x,y)_{k}\}$ ，目标为 $\min\limits_{\theta}\mathcal{L}(\theta,\mathcal{D})$ 。如用典型的损失函数，负对数似然函数（NLL损失函数）：
$\mathcal{L}(\theta,\mathcal{D})=-\mathbb{E}_{(x,y)\sim\mathcal{D}}[\log f_{\theta}(y\ |\ x)]$