paper:Learning Discriminative Aggregation Network for Video-based Face Recognition
论文链接:Learning_Discriminative_Aggregation_ICCV_2017
同样是2017 ICCV的paper,文章提出了一个DAN(discriminative aggregation network)网络,希望从视频流的前端整合信息。主要是GAN+metric learning,用GAN做聚合,用metric增强判别信息。
主要亮点:
结合metric learning 和 adversarial learning。
对于多帧图像,作者选择用GAN来生成有辨别信息的一帧。
对于前期的视频图像处理,有很多学习和探索的空间。
Idea
首先,在特征提取之前做聚合过程有以下几个好处。首先能够明显的加快识别过程,其次能够降低一些低质量图片的污染。
做图像聚合,可以利用GAN的思想:输入一个视频流,然后重建出一张人脸。
但是,GAN生成的问题:GAN只是为了获得一个视觉上更好更接近原图的图片,但是其判别力不足。
作者因此引入了metric的方法,把样本映射到一个特征空间,以提升判别能力。
这篇文章的主要思想就是把GAN和metric learning结合起来。