[论文精读]Can ChatGPT Detect DeepFakes? A Study of Using Multimodal Large Language Models for Media Fore

中文译名:ChatGPT能否检测深度伪造?基于多模态大型语言模型进行媒体取证的研究

发布网站:http://arxiv.org/abs/2403.14077

阅读原因

大模型安全内容相关、方班需要

摘要

深度伪造(DeepFakes)是指人工智能生成的媒体内容,由于其被用作造谣的手段,已日益引起人们的关注。目前,检测 DeepFakes 的问题主要通过编程机器学习算法来解决。在这项工作中,我们研究了多模态大型语言模型(LLM)在检测 DeepFake 方面的能力。我们进行了定性和定量实验来展示多模态大语言模型,并表明它们可以通过仔细的实验符号和提示工程来识别人工智能生成的图像。考虑到 LLM 本身并不是为媒体取证任务量身定制的,而且这一过程不需要编程,因此这 一点非常有趣。我们讨论了多模态 LLMs 在这些任务中的局限性,并提出了可能的改进建议。

研究背景

生成式AI蓬勃发展、应用广泛

1.存在问题

滥用人工智能生成的有害内容严重破坏了信息的可信度和数字媒体的信任度,识别 DeepFakes 已成为媒体取证领域一项重要而紧急的任务。

2.传统方法

检测方法:专用的机器学习算法;基于数据挖掘的深度神经网络模型

存在问题:

  1. 有监督训练,需要标注数据集
  2. 依赖于媒体信息的统计特征
  3. 需要经过特殊的方法调试后方可投入使用

总结:开销大,用户不友好(需要有一定的编程能力)

3.最新研究

检测方法:使用LLM识别面部欺骗和伪造

存在问题:侧重于基于一组单个查询的定性研究,因此只能部分了解 LLMs 在检测 DeepFakes 方面的全部潜力

 4.本文的贡献

对多模态LLM检测DeepFakes的能力进行更加全面的量化评估。

研究侧重点:能够有效诱导LLM做出有意义回答的文本提示形式

核心内容

评估多模态 LLM 在媒体取证中的实用 性和有效性,并选择人工智能生成的人脸图像识别问题作为研究重点。

1.研究方法 

研究中使用了 OpenAI 的 GPT-4V 和 Google Gemini 等多模态模型。测试方法包括向模型输入人脸图像并伴随不同的文本提示,模型需判断图像是否为 AI 生成,并提供解释。

1.1 数据集
  • 1,000 张来自 FFHQ 数据集的真实人脸图像。
  • 2,000 张由 AI 模型(StyleGAN2 和 Latent Diffusion)生成的图像。
  • 使用混合操作如 JPEG 压缩、高斯模糊等对部分图像进行后处理,以评估模型的鲁棒性。
1.2 文本提示

测试了多种文本提示形式,包括直接是/否问题、要求模型提供生成图像的可能性、识别面部伪造的区域等。不同提示的上下文信息丰富程度不同,实验显示提示的设计在 LLM 的表现中起到关键作用。

 

2.实验结果

实验表明,多模态 LLMs 能够利用其语义理解能力在一定程度上区分真实与 AI 生成的图像,达到约 75% 的 AUC 分数。模型的性能并未达到最新专门设计的 DeepFake 检测方法,但它通过自然语言解释使结果更具解释性和可读性。

  • 优点:LLMs 的语义检测能力使其在后处理过的图像(如压缩图像)上表现相对较好,而传统方法则更依赖信号特征。
  • 局限:LLMs 在识别真实图像时表现较差,许多错误出现在真实图像的判断中,说明其语义异常识别有时并非针对 DeepFake 伪造特征。

 3.改进策略

研究提出了可能提升模型性能的策略,包括:

  • 更复杂的提示工程:通过设计链式思维提示(Chain-of-Thought)和少样本提示(Few-Shot Prompting)等更复杂的提示来提高模型的检测能力。
  • 分解式提示:将图像分解为多个局部区域,让模型逐一分析各个部分的合成特征,有助于揭示细微的伪造痕迹。

总结

研究表明,多模态 LLMs 在 DeepFake 检测中展示了一定的潜力,尽管在精确度上不如专门的检测算法,但其易用性和解释能力使其具有独特的优势。未来的研究将探索通过更复杂的提示和结合传统信号驱动方法来提升 LLM 的检测性能,特别是在视频分析和跨模态欺骗检测方面的应用。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值