深度学习方法已被证明对通用识别任务有效。然而,它们的复杂性需求使得它们无法在实时场景中使用。因此,出现了在嵌入式设备上的其他计算机视觉任务中实现实时性能的方法,例如SqueezeNet、ShuffleNet、ShuffleNet v2、MobileNet、MobileNet v2、MobileNet v3和VarGNet。这组方法是为有效解决一般计算机视觉任务(如图像识别、目标检测等)而提出的。
上图显示了针对这些计算机视觉任务的精度性能的乘法加法运算(MADD)基准,以大致了解它们之间的位置。MobileNetV3是通用计算机视觉任务中效率最高、精度最高的网络。
1、用于人脸识别的轻量级卷积神经网络(MobileFaceNet, ShuffleFaceNet ,VarGFaceNet )
使用技术:a、使用分组卷积和混洗输出通道,以减少操作数量,并在不同的输入和输出通道之间共享信息;
b、使用可变分组卷积组来平衡信息保留和复杂性,逐点1×1卷积,以减少深度通道和滤波时的计算复杂性;
c、在完全连接层之前具有低维嵌入,使用跨步而不是最大池操作来降低复杂性并直接从数据中保留更多信息;
d、使用反向瓶颈结构来减少参数数量并再次压缩网络通道以匹配输入通道。
2、知识蒸馏和量化网络
VarGFaceNet使用知识蒸馏进行训练,该方法使用递归知识蒸馏和角蒸馏损失函数。
a、选定的教师网络是一个ResNet体系结构,用于特征向量提取。然后在VarGFaceNet损失函数中使用这些特征向量,以绘制轻量级网络生成的特征向量,使其更接近教师网络的特征向量。
b、角度蒸馏方法使用相似性测量,例如L2或余弦相似性来对两个特征向量进行评分。
3、结论
回顾了最成功的无约束极低分辨率人脸识别方法,同时讨论了最新技术中每种方法的局限性和优势。我们讨论了影响准确性和推理时间性能的因素,以及使用不同训练方法的注意事项。我们分析了在架构级别、损失功能设计和图像表示级别弥合领域差距的影响。有鉴于此,我们还从整体上讨论了深度学习卷积神经网络的最重要趋势,包括胶囊网络、CNN多分支架构和知识蒸馏。