这个问题真的困扰我很久了!!!查了很多资料但是都没有说的很明白,今天问了师兄终于搞明白了,我太难了TAT
1、预训练的数据集划分
元学习实验中,预训练阶段其实并没有什么特殊的数据集划分,跟普通的神经网络训练一样滴!训练集、验证集和测试集的种类肯定是要相同的,只是每个集涉及到的图片数量不同。
比如说我在预训练阶段三个集合的种类都是苹果、香蕉、梨子、西瓜,但是每个集的图片数量是不一样的,一般是训练集:验证集:测试集=7:1:2(比如10张图,训练集7张,验证集1张,测试集2张)
类似这张图,种类数相同都是64种,但是图片数量不同:
2、元训练的数据集划分
元训练阶段为什么种类不一样,是因为我想提高模型的泛化能力,所以我训练完了以后,我要拿我在训练过程中没有见过的图片去验证这个模型是不是有泛化能力。
测试集同理,比如我自认为我这个模型泛化能力够了,我就拿给某个企业用了,这个企业拿去测试的数据肯定是我在训练和验证过程中都没见过的数据。所以这也就是元训练三个集合种类不同的原因。
3、为什么元训练之前需要预训练
因为元训练就是拿很少的数据去训练模型,这样准确率就会很低,所以我们在预训练阶段训练出一个大的模型然后再去做元训练,这样最终的效果就会更好。