- 博客(1)
- 收藏
- 关注
原创 dino训练自己的数据集讨论
dino 结构为teacher 和 student网络,结构都是vit+dinohead。student网络是根据反向传播更新参数,teacher网络是由ema进行参数更新。当我想在teacher网络上加入一个mlp分类头的时候。此时teezcher网络的参数由ema+分类loss的反向传播一起更新。但是分类loss并不下降。我应该怎么排查bug?
2023-06-19 12:56:05 645 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人