AI生成图像技术的进展与影响
技术进步:
- 视觉质量与效率提升:近年来,AI生成图像在视觉质量、语义复杂度及运行时间效率上均实现了显著飞跃。
- 成本降低与普及:生成虚假图像所需的专业知识和成本大幅下降,促使在线图像生成平台(如Midjourney、DALL·E)的兴起,使得普通用户也能轻松根据需求生成图像。
平台与工具发展:
- Midjourney:作为热门平台,已迭代至5.2版本,提供付费服务。
- DALL·E:由OpenAI开发,用户付费后可结合DALL·E 3、ChatGPT Plu版及企业版使用。微软已将其整合至Bing聊天及Microsoft Edge浏览器。
- Stable Diffusion:Stability AI开源了v2.0、v2.1等版本,支持在线及本地计算,通过文字输入生成高质量图像。
- 中文支持平台:Pixeling、wukong等平台支持中文text-to-image功能。
社会影响与担忧:
- 虚假信息传播:AI图像生成技术的普及加剧了虚假信息传播的担忧。
AIGC生成图像检测方法
[CNNSpot] CNN生成的图像惊人地容易被识别...目前
CNNSpot提出了一种简单而有效的伪造图像检测器。他们采用ResNet-50作为分类器,并观察到包括JPEG压缩和高斯模糊在内的数据增强可以提高检测器的泛化能力,这意味着检测器可以很好地泛化到未见过的架构、数据集和训练方法。
[GramNet] 野外伪造面部检测中的全局纹理增强
GramNet观察了伪造面部和真实面部之间的纹理差异。基于这一观察,他们旨在通过将全局纹理提取融入常见的ResNet结构中,来提高检测器的泛化能力和鲁棒性。
[FreDect] 利用频率分析进行深度伪造图像识别
FreDect揭示了在频率空间中,GAN生成的图像会表现出严重的伪影,这些伪影很容易被识别。基于这一分析,他们提出了伪造图像的频率异常,并从频率域进行伪造图像检测。
[Fusing] 融合全局和局部特征以实现通用的AI合成图像检测
Fusing使用双分支模型从整个图像中提取全局空间信息,并从由新型补丁选择模块选择的多个补丁中提取局部信息特征。全局和局部特征通过多头注意力机制进行融合。然后,训练一个分类器来基于融合后的特征检测伪造图像。
[LNP] 通过真实图像检测生成图像
LNP观察到真实图像的噪声模式在频率域中表现出相似的特征,而生成图像的噪声模式则截然不同。因此,它基于一个训练良好的去噪模型提取空间图像的噪声模式。然后,它从噪声模式的频率域中识别伪造图像。
[LGrad] 基于梯度学习:GAN生成图像检测的通用伪影表示
LGrad提取了一个训练良好的图像分类器获得的梯度图,作为GAN生成图像的指纹。这种方法将数据依赖问题转化为变换模型依赖问题。然后,它基于梯度图进行二分类任务。
[UnivFD] 迈向跨生成模型的通用伪造图像检测器
UnivFD使用由大型预训练视觉-语言模型(CLIP:ViT-L/14)提取的特征空间来训练检测器。大型预训练模型导致平滑的决策边界,这提高了检测器的泛化能力。
[DIRE] 用于扩散生成图像检测的DIRE
DIRE致力于识别由扩散模型生成的伪造图像。他们观察到扩散模型可以近似重建扩散生成的图像,而真实图像则不能。基于这一观察,他们利用预训练扩散模型对输入图像及其重建图像之间的误差作为指纹。
[PatchCraft (RPTC)] PatchCraft:探索纹理补丁以实现高效的AI生成图像检测
PatchCraft利用图像中丰富纹理区域和贫乏纹理区域之间的像素间相关性对比。丰富纹理区域中的像素表现出比贫乏纹理区域中的像素更显著的波动。基于这一原理,我们将图像分成多个补丁,并将它们重建为两幅图像,分别包含丰富纹理补丁和贫乏纹理补丁。随后,我们提取丰富纹理区域和贫乏纹理区域之间的像素间相关性差异特征。这一特征作为跨不同生成模型的AI生成图像取证的通用指纹。
评估数据