Meta Learning 简述

最新推荐文章于 2023-08-05 01:39:15 发布

MezereonXP

最新推荐文章于 2023-08-05 01:39:15 发布

阅读量298

点赞数

分类专栏：深度学习机器学习算法文章标签：深度学习机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34206952/article/details/117389486

版权

深度学习同时被 3 个专栏收录

36 篇文章 4 订阅

订阅专栏

35 篇文章 2 订阅

订阅专栏

25 篇文章 0 订阅

订阅专栏

Meta Learning 简述

先来回顾一下，传统的机器学习或者说深度学习的流程：

确定训练和测试数据集
确定模型结构
初始化模型参数（通常是一些惯用的随机分布）
初始化优化器类型和参数
进行训练，直到收敛

Meta Learning的目的是去学习一些在步骤2，3，4的参数，我们称之为元知识(meta- knowledge)

不妨对其进行形式化

假设数据集为 $D = \{(x_1,y_1),...,(x_N,y_N)\}$ 其中 $x_i$ 是输入， $y_i$ 是输出标签

我们的目的是得到一个预测模型 $\hat{y} = f(x;\theta)$ , 其中 $\theta$ 表示模型的参数， $x$ 为输入同时 $\hat{y}$ 是预测的输出

优化的形式为：
$\theta^*=\arg \min_{\theta} \mathcal{L}(D;\theta,\omega)$
其中的 $\omega$ 就是元知识，包括：

优化器类型
模型结构
模型参数的初始分布
…

我们会对已有的数据集 $D$ 进行任务划分，切分成多个任务集合，每一个任务集合包括一个训练集合以及一个测试集合，其形式为：
$D_{source} = \{(D^{train}_{source},D^{val}_{source})^{(i)}\}_{i=1}^{M}$
优化目标为:
$\omega^* = \arg \max_{\omega} \log p(\omega|D_{source})$
也就是在我们切分的多个任务集合中，找到一组配置（也就是元知识），使其对于这些任务来说最优。

一般称这个步骤为元训练(meta-training)

找到 $\omega^*$ 之后，便可以应用到一个目标任务数据集 $D_{target} = \{(D_{target}^{train}, D_{target}^{val})\}$

在这上面进行传统的训练，也就是找到一个最优的模型参数 $\theta^*$
$\theta^* = \arg\max_{\theta}\log p(\theta|\omega^*, D_{target}^{train})$
这个步骤称之为元测试(meta-testing)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Meta Learning 简述

Meta Learning 简述先来回顾一下，传统的机器学习或者说深度学习的流程：确定训练和测试数据集确定模型结构初始化模型参数（通常是一些惯用的随机分布）初始化优化器类型和参数进行训练，直到收敛Meta Learning的目的是去学习一些在步骤2，3，4的参数，我们称之为元知识(meta- knowledge)不妨对其进行形式化假设数据集为 D={(x1,y1),...,(xN,yN)}D = \{(x_1,y_1),...,(x_N,y_N)\}D={(x1,y1),...,(
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。