论文阅读《Combining EfficientNet and Vision Transformersfor Video Deepfake Detection》

一只发呆的猪

已于 2024-02-25 11:00:36 修改

阅读量450

点赞数 8

文章标签：论文阅读

于 2024-02-07 15:33:43 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_56180495/article/details/136055084

版权

项目链接： https://github.com/davide-coccomini/
Combining-EfficientNet-and-Vision-Transformers-for-Video-Deepfake-Detection.

论文的整体架构和思路：

将cnn与vit相结合的思路，使用DFDC数据集进行训练和测试

作者提出了cnn与vit结合的两种思路

（a）第一种是使用预训练好的efficientnet b0进行特征提取，然后将图像切分成7*7的patch块经过线性映射，输入到vit中进行下一步处理

efficientnet为输入面部的每个块生成一个视觉特征。每个块是7 × 7像素。在线性投影之后，每个空间位置的每个特征都被视觉转换器进一步处理。添加到线性映射序列后的头部，CLS令牌用于生成二进制分类分数。

（b）将预训练好的模型提取后的特征图，分为两个分支，一个是s分支，将图像划分为7*7的patch块，另一个是L分支，将图像划分为64*64的patch块，这样做的目的是以捕获更丰富的信息和上下文。最后，使用与两个分支的输出相对应的CLS令牌生成两个独立的日志。这些对数被求和，产生最终的概率。

-------------------------------------------------------------------------------

S分支将图像划分为较小的7x7的patch块，以便对图像的局部细节进行分析。这种细粒度的划分可以帮助模型捕获图像中的细微变化、纹理和局部特征。

L分支将图像划分为较大的64x64的patch块，以便对图像的全局特征进行分析。这种粗粒度的划分可以帮助模型捕获图像的整体结构、布局和上下文信息。

与传统的直接得出分类结果不同的是，作者使用投票法得出分类结果

一只发呆的猪

关注

8
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
论文阅读《Combining EfficientNet and Vision Transformersfor Video Deepfake Detection》

（b）将预训练好的模型提取后的特征图，分为两个分支，一个是s分支，将图像划分为7*7的patch块，另一个是L分支，将图像划分为64*64的patch块，这样做的目的是以捕获更丰富的信息和上下文。最后，使用与两个分支的输出相对应的CLS令牌生成两个独立的日志。这些对数被求和，产生最终的概率。（a）第一种是使用预训练好的efficientnet b0进行特征提取，然后将图像切分成7*7的patch块经过线性映射，输入到vit中进行下一步处理。S分支将图像划分为较小的7x7的patch块，以便。
复制链接

扫一扫

一只发呆的猪 CSDN认证博客专家 CSDN认证企业博客

码龄3年

33: 原创

76万+: 周排名

6万+: 总排名

2万+: 访问

: 等级

637: 积分

184: 粉丝

269: 获赞

27: 评论

287: 收藏

私信

关注

热门文章

分类专栏

人工智能 2篇
机器学习 2篇

最新评论

FF++数据集下载脚本代码
一只发呆的猪: 蛮久的，经常中断，不过我只下载了c40的视频
FF++数据集下载脚本代码
m0_62423084: 作者下了多久啊，我换了EU2但是进度一直是0，就这样：0/3068 [00:00<?, ?it/s]
FF++数据集下载脚本代码
Tiamo_wey: 博主，您好。请问数据集下载下来了吗？能否分享一份呢？十分感谢~
FF++数据集下载脚本代码
2301_77487668: 请问博主现在下载好了吗，可以分享一份嘛
关于空频变换的知识点
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。