论文笔记:Once for All- Train One Network and Specialize it for Efficient Deployment
来源:MIT,MIT-IBM Waston AI Lab,paper,preprint总的来说,本文有一下几点值得关注采用了一次性训练超网并抽取子网的方式,个人感觉这是 cascade 等多阶段思路的延续,及后续网络只是进一步细化/处理较难任务,网络前期就已经有分类能力了为了增强抽取子网的效果,提出了 PS 的训练方法,训练过程感觉作者说的不是很清楚,感觉是通过多种 loss 共同作用训...


