关于验证集:
如果在model.fit中设置validation_spilt的值,则可将数据分为训练集和验证集,例如,设置该值为0.1,则训练集的最后10%数据将作为验证集,设置其他数字同理。注意,原数据在进行验证集分割前并没有被shuffle,所以这里的验证集严格的就是你输入数据最末的x%。
向BN层中载入权重:
按照BN的文章顺序,似乎载入Keras BN层的参数应该是[mean, std, gamma, beta];
然而不是的,Keras的BN层参数顺序应该是[gamma, beta, mean, std],这是因为gamma和beta是可训练的参数,而mean和std不是;
Keras的可训练参数在前,不可训练参数在后;
错误的权重顺序不会引起任何报错,因为它们的shape完全相同。
shuffle和validation_split的顺序:(和第一点类似)
模型的fit函数有两个参数,shuffle用于将数据打乱,validation_split用于在没有提供验证集的时候,按一定比例从训练集中取出一部分作为验证集;
这里有个陷阱是,程序是先执行validation_split,再执行shuffle的,所以会出现这种情况:假如你的训练集是有序的,比方说正样本在前负样本在后,又设置了validation_split,那么你的验证集中很可能将全部是负样本;
同样的,这个东西不会有任何错误报出来,因为Keras不可能知道你的数据有没有经过shuffle,保险起见如果你的数据是没shuffle过的,最好手动shuffle一下。