对于GAN(生成对抗网络)生成图片的检测(一)

一、背景

        GAN生成的假图片现在已经十分成熟,基于人眼很难识别。GAN包含好多种类型,ProGAN、StyleGAN、BigGAN、BigGAN、GauGAN等等。他们生成的假图片都有自己各家的特色。

二、基于频谱的对真假图片的分类器模型

        基于频谱的分类器模型是指将图像转换为其频域表示,然后使用频率信息作为输入特征来训练分类器模型

        GAN生成的图纸中会包含上采样结构,上采样是一种图像处理技术,用于将低分辨率图像或低质量图像增加到较高的分辨率或更好的质量。然而,上采样过程可能会引起伪像。在研究中表明伪像,在频域中表现为频谱的复制,这在频谱图上表现十分明显。

三、实现的步骤想法

        1、数据集有ImageNet(ImageNet数据集简介与下载详细步骤_imagenet数据集下载-CSDN博客)、利用ProGAN生成的假图片和真图片构成的数据集等。

        2、对数据进行扩增,就是对图片进行翻转,模糊等操作,增强模型对图片鉴别的泛化,也可以增强数据的多样性。

        3、导入深度学习框架(如TensorFlow、PyTorch等)和ResNet-50预训练模型

        4、之后在构建一个模型,并加载ResNet-50的预训练权重(使用了在大规模图像数据集上进行预先训练的ResNet-50模型的参数),使用大型卷积神经网络ResNet-50来对频谱特征进行提取

        5、计算频谱之间的相关性或相似性,使用互相关来计算两个频谱之间的相似度。互相关衡量了频谱之间的相关性,可以检测到频谱中的复制或相似模式。(还有其他的方法例如余弦相似度、KL 散度、相关系数,这里感觉互相关更合适)

        6、用平均精度来衡量模型鉴别的好坏

参考文献:1912.11035.pdf (arxiv.org)[1912.11035] CNN生成的图像非常容易被发现......目前 (arxiv.org)

  • 14
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值