【CViT】Deepfake Video Detection Using Convolutional Vision Transformer

Deepfake Video Detection Using Convolutional Vision Transformer

会议/期刊:2021
作者:
在这里插入图片描述

key points

提出了一种用于检测深度伪造的卷积视觉变压器【CNN+VIT】

CNN提取可学习的特征,而ViT将学习到的特征作为输入,并使用注意机制对其进行分类。

我们的工作基于[10,11]指出的Deepfake检测方法的两个弱点:数据预处理和通用性。

我们提出了一种广义卷积视觉变压器(CViT)架构,使用卷积神经网络和变压器架构来检测Deepfake视频。

称我们的方法是一般化的,主要有三个原因。
1)我们提出的模型利用Transformer的注意力机制,利用CNN和Transformer架构学习局部和全局图像特征[6]。
2)我们在训练和分

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值