文章目录
Combining EfficientNet and Vision Transformersfor Video Deepfake Detection
会议:ICIAP 2022
作者:
code:
https://github.com/davide-coccomini/Combining-EfficientNet-and-Vision-Transformers-for-Video-Deepfake-Detection
key points
将各种类型的视觉变压器与卷积effentnet B0结合起来作为特征提取器
与最先进的方法不同,我们既不使用蒸馏方法,也不使用集合方法。此外,我们提出了一个基于简单投票方案的直接推理程序,用于处理同一视频镜头中的多个面孔。
图像的局部+全局特征分析【粗细粒度分析】