论文阅读:Model-Agnostic Meta-Learning for Fast Adaptation of Deep Networks
这张图详细解释了MAML算法的工作流程,p(T)可以理解成该算法所使用的训练集,可以看到,在line 4-7,该算法先针对batch中的每一个任务单独做了一遍gradient descent,并记录了更新后的参数(注意,在此时并没有对主模型进行更新,可以理解为对于每一个单独的任务,单独为其复制了一个模型,并在这个模型上进行梯度下降并更新参数,主模型参数不变)。红线是ground truth,蓝三角是训练样本,绿线是MAML训练效果,蓝线是预训练模型的效果。这是一篇介绍MAML的老文章了,2017年写的。
原创
2023-09-01 17:13:40 ·
123 阅读 ·
1 评论