Python元学习-通用人工智能的实现第1章阅读笔记_hands-on meta learning with python-CSDN博客

本文链接：https://blog.csdn.net/qq_56039091/article/details/127239583

本书代码：https://github.com/sudharsan13296/Hands-On-Meta-Learning-With-Python
本书ISBN号：9787115539670

在这里插入图片描述

第1章

1.1 元学习

元学习能够生成一个通用的人工智能模型来学习执行各种任务，而无须从零开始训练它们。我们可以用很少的数据点来训练元学习模型去完成各种相关的任务，因此对于一个新任务，元学习模型可以利用之前从相关任务中获得的知识，无须从零开始训练。

数据集中有两个类别，即狗和猫，所以可以称之为双（n = 2）类别k 样本学习——n 表示数据集中类别的数量。k 样本学习中的k 表示每个类别中数据点的数量。

为了使模型从少量的数据点中学习，我们将用同样的方法训练它们。因此，当有一个数据集D 时，我们从数据集中的每个类别中挑选几个数据点，称之为支撑集（support set）。同样，从每个类别中挑选一些不同的数据点，称之为查询集（query set）。于是，我们用一个支撑集训练模型，并用查询集来测试模型。我们以一种阶段式的方式（episodic fashion）训练模型，即在每个阶段中，从数据集D 中抽取少量数据点，准备支撑集和查询集，并使用支撑集进行训练，使用查询集进行测试。因此，在多个阶段后，模型将学会如何从较小的数据集中学习。

1.2 元学习的类型

学习度量空间
学习初始化
学习优化器

1.2.1 学习度量空间

在基于度量的元学习场景中，我们将学习合适的度量空间。假设我们想学习两幅图像之间的相似性。在基于度量的场景中，我们使用一个简单的神经网络从两幅图像中提取特征，并通过计算两幅图像特征之间的距离找到相似性。这种方法被广泛应用于数据点较少的少样本学习中。接下来的章节将介绍基于度量的学习算法，如孪生网络、原型网络和关系网络。

1.2.2 学习初始化

在这个方法中，我们尝试学习最优的初始参数值。这是什么意思呢？假设我们正在构建一个神经网络来对图像进行分类。我们首先初始化随机权重，计算损失，并通过梯度下降来最小化损失。因此，我们将通过梯度下降找到最优权重，使损失最小。如果不随机初始化权重，而是用最优值或者接近最优值的值来初始化权重，那么就可以更快地收敛，并快速学习。接下来的章节将介绍如何通过MAML、Reptile 和Meta-SGD 等算法来精确地找到这些最优的初始权重。

在MAML 和Reptile中，我们试图找到更好的、可在多个相关任务间泛化的模型参数，这样就可以用更少的数据点快速学习。