Adaptive Normalized Representation Learning for Generalizable Face Anti-Spoofing论文阅读笔记

最新推荐文章于 2024-10-19 09:04:10 发布

好香-

最新推荐文章于 2024-10-19 09:04:10 发布

阅读量319

点赞数

分类专栏：活体检测文章标签：图像处理人工智能

本文链接：https://blog.csdn.net/weixin_44171651/article/details/124920452

版权

活体检测专栏收录该内容

1 篇文章 0 订阅

订阅专栏

论文基本信息

作者：Shubao Liu,Ke-Yue Zhang, Taiping Yao

机构：华东师范大学、腾讯

来源：ACM MM

时间：2021

链接：[2108.02667] Adaptive Normalized Representation Learning for Generalizable Face Anti-Spoofing (arxiv.org)

基础知识

1.BN&IN

深度学习中的Normalization模型 - 知乎 (zhihu.com)

常见面试问题2：归一化-BN、LN、IN、GN_哔哩哔哩_bilibili

BN：对一个batch里所有的图片的所有像素求均值和标准差

IN：对单个图片的所有像素求均值和标准差

DNN中的规范化操作分为两类

对第L层每个神经元的激活值或者对第L+1层网络神经元的输入值进行Normalization操作，比如BatchNorm/LayerNorm/InstanceNorm/GroupNorm
对神经元网络中连接相邻隐层神经元之间的边上的权重进行规范化操作，比如L1/L2正则

规范化目标：将激活值规整为均值为0，方差为1的正态分布

输入4张图片，通道数是3，大小是240*240

上图中，从C方向看过去是指一个个通道，从N看过去是一张张图片。每6个竖着排列的小正方体组成的长方体代表一张图片的一个feature map。蓝色的方块是一起进行Normalization的部分

BN批归一化：分3次进行归一化，每次对4张图片的某个通道层的数共同归一化

LN层归一化：4张图片进行4次归一化，每次对一整张图

IN：要进行12次，每张图片的每个通道分别归一化

GN：对通道数分组进行归一化

2.RelU、sigmoid、softmax

使用情形

3.soft attention

Soft Attention Model - 云+社区 - 腾讯云 (tencent.com)

Attention算法调研(四) —— 视觉应用中的Soft Attention - 知乎 (zhihu.com)

软性注意力机制(Soft Attention)是指在选择信息的时候，不是从n个信息中只选择一个，而是计算n个输入信息的加权平均，在输入到神经网络中计算

4.intra-class(类内距离)与inter-class(类间距离)的区别

“inter” means “between” or “among”.

“intra” means “within”.

从international（国际的）和intranational（国内的）的角度来思考。第一个是“跨多个国家”，第二个是“在一个国家内”。在涉及尝试将样本分配给类别的许多问题中，目标是最大化类别间的差异，并最小化类别内的差异。也就是说，每个类别中的样本必须尽可能相似，而不同类别中的样本必须尽可能不同

5.FPR-FNR图

(1条消息) FAR(FPR)与FRR(FNR)的曲线绘图以及EER计算绘图_NJU_dislab_XC的博客-CSDN博客_far和frr曲线怎么画

(1条消息) 人脸识别模型评价指标：完整梳理_Robin_Pi的博客-CSDN博客_人脸识别评价指标

(1条消息) 真阳率（true positive rate）、假阳率（false positive rate），AUC，ROC_生活不只*眼前的苟且的博客-CSDN博客_false positive rate

图片含义：

false positive rate：真实是假，预测是真

false negative rate ：真实是真，预测是假

曲线下面积越小越好

问题--已解决

曲线名称比如有ROC、AUC这个是什么

意义怎么分析

6.t-SNE可视化

通过视觉直观验证算法有效性，或者说是算法评估

t-SNE可视化

问题

好的算法是把同个域的聚集到一起，把源域中的真脸和目标域中的真脸聚到一起？

解决的主要问题

大多数研究集中于寻找一个域泛化空间，很少工作关注FAS的特征提取过程，尤其是归一化

基于CNN的方法在跨数据集场景下性能会显著下降，原因是只关注了训练数据，忽略了源域之间以及位置域的域偏差

摘要

本文精力集中于特征提取过程中的归一化选择，设计了一个自适应归一化表达框架，会根据输入自适应选择归一化方法，还设计了双重校准约束，包括域内兼容损失和类内可分损失

图1 将BN和IN在相同源域上训练

性能左边：BN>IN 右边：IN>BN

分析原因 BN和IN的特性不同

BN	当未知域与源域相比有轻微域偏移时，BN表现更好，但是BN很容易被域信息影响，大幅域偏移->性能严重下降
IN	会消除每个样本的独特性信息，对域偏移更包容

BN和IN结合方法