论文阅读-NOLANet多模态伪造检测

本文介绍了一种名为NOLANet的多模态深度学习方法,用于检测深度伪造视频。NOLANet包含三个子网络:VSNet(视觉+频谱)、FourierNet(音频信号+频谱)和LipSpeech(唇读+语音)。通过融合不同模态的特征,NOLANet提高了检测精度,尤其是在音频和视觉信息的对齐方面。研究使用了DFDC数据集进行训练和测试,结果显示XceptionNet与其他模态特征结合时表现最佳。
摘要由CSDN通过智能技术生成

一、论文信息:

  • 题目:Deepfake Video Detection Based on Spatial,Spectral, and Temporal Inconsistencies UsingMultimodal Deep Learning(多模态伪造检测——视觉+频谱+语音)

  • 作者团队:

  • 会议:AIPR 2020

二、背景与创新

  1. 背景:合成视频威胁到数字媒体的信任与隐私,许多deepfake检测方法使用单帧视频,并且只专注于图像中的空间信息或被操纵视频的时间不一致性来实现鉴伪,单模态。

  1. 创新:作者提出一种混合深度学习方法,建立了一个多模态网络来检测深度伪造视频,主要包括三个子网络:唇读+语音识别特征、音

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值