文章目录
Deepfake Video Detection Based on Spatial,Spectral, and Temporal Inconsistencies Using Multimodal Deep Learning
会议:AIPR W 2020
作者:
许多DF检测方法使用的单针视频
创新
多模态检测——视觉+频谱+语音
提出了一种混合的深度学习方法,它使用空间、光谱和时间内容,以一致的方式耦合来区分真实视频和假视频。
BlazeFace的检测模型。这个模型可能是用于检测视频中人脸的关键点。
FANet面部对准网络——检测面部标志,并分别裁出眉眼、鼻部和唇部【眉眼/唇部=2:1;鼻部1:1】
在时间上对齐视觉和音频特征
我们使用离散余弦变换而不是傅里叶变换。