NAN论文解读:Neural Aggregation Network for Video Face Recognition

这篇CVPR2017论文介绍了Neural Aggregation Network,用于视频中的人脸识别。网络包括特征嵌入模块(使用GoogLeNet+Batch Normalization)和聚合模块,后者能学习自适应池化策略,融合多帧人脸特征,提升识别准确性。
摘要由CSDN通过智能技术生成


Neural Aggregation Network for Video Face Recognition是CVPR2017的一篇论文,来源https://arxiv.org/abs/1603.05474。


主要目标是做基于视频的人脸识别。

网络分两个模块:

模块1 Feature embedding module:采用GoogLeNet+Batch Normalization的普通人脸识别网络,针对每张图像或者每帧图像的input,得到128D的特征向量。

模块2 Aggregation module:此乃本文的创新点,同一个人的多张图像或者视频序列通过模块1可以得到多个特征向量,将这些特征向量作为模块2的input,模块2能够学习到自适应的,内容相关的池化策略,从而得到一个融合后的128D的特征向量。


下图为本文架构核心:

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值