YOLOMAML:两重循环,外循环用来更新meta-learner的参数,内循环用来更新base-learner的参数,meta-learner和base-learner是一个网络。外循环每次迭代,采样很多个任务{T1-Ti},每个任务使用meta-learner的参数\theta,初始化base-learner,然后梯度下降number_of_updates_per_task次,然后使用Ti中的query数据和更新多步后的base-learner计算loss,对meta-learner的参数\theta求导,记录这个任务下meta-learner参数的梯度。训练完T1-Ti后,计算这i个任务meta-learner参数的梯度的平均值,更新一次meta-learner,外循环一次迭代完成。进行下次迭代,再次采样任务。