Meta Learning
这样理解:我们的目标是能够few shot learning也就是说,每一类看一两个样本就能够学会如何区分这些类,于是乎一个task就定义为:每一类看一两个样本,然后在新的样本(但是是刚才看过的类)上进行分类。
MAML理解:
感谢李宏毅老师的讲解!
在maml pytorch中,它每次都是torch.autograd.grad(loss, fast_weight),所以根本不可能传回去,就一阶
在maml pytorch rl中,如果选择了first_order=False,则会保留计算图,然后用loss对policy.parameters进行求导,则可以求出二阶导数来做。