边策 鱼羊 发自 凹非寺
量子位 报道 | 公众号 QbitAI
现如今,GAN的效果已经越来越出神入化。
比如英伟达的GauGAN,就如神笔马良,能够凭空造物:
不过,从无化有背后,计算量也相当惊人。
以GauGAN为例,与MobileNet-v3这样的识别CNN相比,参数只相差1个数量级(4.2 : 93)计算强度却高出了2个数量级(0.5 : 281)。
如此一来,交互式部署就变得很困难。
更直白来说,想要把模型部署到手机、平板这样的终端,换装变脸转性别,这些边缘设备——吃不太消。
为了解决这一问题,来自MIT、Adobe研究院和上海交通大学的团队琢磨出了一个通用压缩框架。
有多强?
一举将CycleGAN的计算量减少了20倍以上,将GauGAN的计算量减少了9倍,简笔画到实物图的pix2pix也能驾驭,效果却未差分毫。
值得一提的是。论文已入选CVPR 2020,代码也已开源。
作者团队也星光璀璨,一作是来自上海交通大学ACM班的本科生李沐阳,CycleGAN的作者朱俊彦则亲身参与、指导。
GAN压缩算法
压缩GAN,并不像压缩其他CNN模型那样容易。
主要原因:GAN的训练动力学高度不稳定,生成器与鉴别器之间存在巨大的结构差异,让我们很难使用现有的CNN压缩算法。
为了解决这个问题,作者提出了针对有效生成模型量身定制的训练方案,并通过神经架构搜索(NAS)进一步提高压缩率。
GAN压缩的框架如下图所示,主要分为3个部分:
1、给定一个预训练的teacher生成器G’,通过蒸馏的方法获取一个较小的“once-for-all”的student生成器Gÿ