基于特征重建的知识蒸馏方法
期刊:图形图像
时间:2020
研究院:北京信息科技大学
关键词:深度神经网络;模型压缩;知识蒸馏;特征重建;风格迁移;图像分类
方法简介
思想来源
传统的知识蒸馏忽略了教师模型的互相交互,而一些新模型 Zhou[10]、Mirzadeh[11]等人提出的模型虽然有了交互过程,但是网络交互方式大大限制了学生网络的灵活性。由此本文结合图片风格迁移实验中的特征重建方法提出了一种新的知识蒸馏方法。
具体方法
特征重建算法
Johnson 等人[13]在图片风格迁移实验中发现,两张图片输入同一个网络时,图片的内容越相似则网络的深度特征越相似。于是在图片风格迁移实验中提出了特征重建损失函数。此损失函数是由已经训练好的 VGGNet[14]计算得到的,将 VGGNet 作为损失函数产生网络,用来训练图片风格迁移网络。风格迁移实验内容迁移(即特征重方法)的训练架构如图 3 所示
其中 y 为图片生成网络生成的新图片,yc 为图片生成网络生成新图片的目标图片。实验中 VGGNet 的深度特征欧氏距离越小,则图片生成网络生成的图片内容越接近目标图片。由此也可以得出特征重建损失函数。此损失函数如下:
后续没看懂