Radek‘s notebook

_helen_520

已于 2023-09-01 23:10:38 修改

阅读量175

点赞数

文章标签：深度学习

于 2023-08-17 14:52:04 首次发布

本文链接：https://blog.csdn.net/haronchou/article/details/132340466

版权

2023-09-01周五更新：revisit

为什么loss下降的不多了，后面的epoch中（当然了，6个样本，指望loss怎么工作？），但是神奇的是：acc在valid上是怎么增加的？？
是不是网络的loss虽然在微调，样本太少导致的，但是实际上还是在向有利的acc上前进！
- 那么此时调整的最后的分类器，还是特征提取呢？
- 会不会是在调整分类器呢？毕竟只有6个训练样本

kaggle的dogs vs cats数据集：

VGG16 lr=1e-4, Adam优化器：从头开始训练，训练所有参数
1. 很快train-loss=0，acc比乱猜还差；乱猜也有50%的概率撒。
2. 肯定啊：就6个样本，学习个毛线啊！！！那么多参数，6个样本学习1亿个参数，咋个可能呢！！
VGG16-Radek's net：7*7的max pool层，减少了大部分的全连接的参数量；模型减小到了65M；loss不会到0了，但是网络基本不动了！！
loss到0和不到0，两回事哦！
加入imagenette的预训练权重：loss开在0.384不动了，但是acc基本80%
把feature层，也就是VGG backbone给冻住：只训练后面的分类层，acc明显增加了好多！但loss还在没动。