这篇论文不是用作模型压缩的,作者想的是让student超越teacher
其训练方式如下:
实验结果,student超越teacher了:
Knowledge Distillation(10)——Born Again Neural Networks
最新推荐文章于 2023-04-11 21:49:17 发布
这篇论文不是用作模型压缩的,作者想的是让student超越teacher
其训练方式如下:
实验结果,student超越teacher了: