信息隐藏|Generative Steganography Network

csq7

已于 2023-12-27 10:43:26 修改

阅读量1.2k

点赞数 18

文章标签：计算机视觉人工智能论文阅读

于 2023-12-27 10:40:38 首次发布

本文链接：https://blog.csdn.net/qq_44654715/article/details/135238695

版权

文章介绍了GSN，一种无需载体图像的生成隐写方法，通过互信息机制提高秘密提取精度。模型包含生成器、鉴别器和隐写分析器，旨在生成逼真且安全的隐写图像，对抗隐写分析。文章还探讨了训练策略和评价指标，如FID、Acc和Pe。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

来源ACMMM2022

提出问题：

隐写术通常修改载体媒体以嵌入秘密数据。最近出现了一种新的隐写方法，称为生成隐写(GS)，其中隐写图像(包含秘密数据的图像)直接从秘密数据生成，而不需载体盖介质。然而，现有的GS方案经常因性能差而受到批评。

解决问题：

本文中提出了一种先进的生成隐写网络(GSN)在不使用载体图像的情况下生成逼真的隐写图像。

首先引入了互信息机制，这有助于实现高的秘密提取精度。模型包含四个子网络，即图像生成器(𝐺)，鉴别器(𝐷)，隐写分析器(𝑆)和数据提取器(E)。𝐷和𝑆作为两个对抗的鉴别器，以确保生成的隐写图像的视觉质量和安全性。E从生成的隐写图像中提取隐藏的秘密。生成器𝐺构造灵活，可以根据不同输入合成载体或隐写图像。它将生成隐秘图像的功能隐藏在普通生成器中，从而方便了隐秘通信。在图像生成过程中设计了秘密块模块，将秘密数据隐藏在特征映射中，具有较高的隐藏能力和图像保真度。提出了一种新的分层梯度衰减(HGD)技术来抵抗隐写分析检测。

什么是生成式隐写术？：

修改载体图像会造成视觉或统计上的扭曲，使得隐写图像很容易被隐写分析工具检测出来。一旦被发现，隐蔽通信的行为就会失败。为了解决这一问题，一种新的隐写方式——生成隐写(GS)应运而生。它不是通过修改封面图像来嵌入秘密数据，而是直接从秘密数据合成隐写图像，如图所示。在GS中不需要载体图像，因此隐写分析工具将变得无效。原理图如下：

输入的秘密数据通过生成器转换为自然隐写图像，然后这些图像通过无损信道传输。

通过提取器可以从接收到的隐写图像中恢复隐藏的秘密数据。

本文提出的GSN方法：

本文提出的GSN架构如图所示，它由生成器(G)、鉴别器(D)、隐写分析器(S)和提取器(E)组成，其中D和S作为GAN中的两个鉴别器，可以保证视觉质量，减少生成的载体/隐写图像之间的差异。

GSN的输入包括潜在向量z、噪声矩阵n或秘密数据d的三维矩阵。根据(z, n)和(z, d)中哪个是输入，生成器可以生成载体图像x c或隐进图像xs。然后，将真实图像和生成的隐写图像发送给鉴别器来判断它们是真还是假。同时，将生成的载体/隐写图像送入隐写分析仪进行差分。将生成的隐写图像输入到提取器中，d '为预测的秘密。

当输入(z, n)/(z, d)时，可以生成载体/隐写图像。（输入的组合不同，输出不同）

D和S作为双重鉴别器，保证了载体/隐写图像的视觉质量和统计不可感知性。E的目的是从生成的隐写图像中恢复隐藏的秘密。

问题公式化：

在本文方案中，可以使用秘密数据d和潜在数据z生成一幅隐写图像，即xs =𝐺(z, d)。秘密数据影响图像内容，需要从生成的隐写图像xs中精确地恢复图像内容。从信息论的角度来看，期望d与xs之间的互信息最大，即max𝐼(d，𝐺(z, d))。也就是说，输入的秘密数据和生成的隐写图像是密切相关的。当输入的秘密数据发生变化时，需要生成不同的隐写图像，并希望从生成的隐写图像中准确提取出隐藏的秘密。因此，我们将互信息整合到GAN中进行数据隐藏。损失函数可定义为:G想要最小化而D想要最大化这个损失函数。

但是互信息𝐼(d，𝐺(z, d))很难得到，因为它需要后验分布𝑝(d |𝐺(z, d))。受Infogan的启发，使用变化下界L𝑑(𝐺，E)来近似𝐼(d，𝐺(z, d)):

在本文方案中，G可以合成载体图像(xc =𝐺(z, n))和隐写图像(xs =𝐺(z, d))。隐写分析器S采用了一种隐写分析算法SR-net作为主干，其目的是最小化生成的隐写/隐写图像之间的统计差异。G和S之间的对抗损失写成L𝑆(𝑆，𝐺)。与L𝑑(𝐺，E)不同，S希望在二值交叉熵损失的情况下输出正确的预测结果([0,1]或[1,0])，而G希望S对载体图像和隐写图像都输出[0.5,0.5]，如Eq.7和Eq.10所述。G和S的目标都是最小化这两种损失。

为了生成真实、高秘密提取率和良好不可检测性的隐写图像，我们结合上述损失函数，将整体优化目标设置为:

这里，G, S和E都希望最小化𝐿𝑡𝑜𝑡𝑎𝑙(𝐷，𝐺，𝑆，)，而D希望最大化它。𝜆λ和𝛽β是两个超参数。

损失函数：

在本节中，将𝐿𝑡𝑜𝑡𝑎𝑙(𝐷，𝐺，𝑆，E)分解为每个子网络的特定损失函数。

生成器的损失考虑了两个对抗性训练过程和一个正则化项:L𝑎𝑑𝑣是𝐷和𝐺之间的对抗损失。L𝑠𝑡𝑒𝑔是G对S的对抗损失，这确保了𝑆的输出对于载体图像和隐写图像都接近0.5(即𝑆无法区分图像的来源)。

鉴别器损失定义为：

隐写分析器损失为：在隐写分析器(S)中采用了二值交叉熵损失。S输出一个二维向量，而不是像GAN那样的标量，被训练为输出输入载体/隐写图像的正确预测([0,1]或[1,0])。y1/y2为载体/隐写图像的GT值。

提取隐藏秘密的损失由二值交叉熵计算，预测结果F(如图所示)，加入噪声，输入二值数据d:

𝑆i𝑔𝑚𝑜i𝑑(·)使结果属于(0,1)。在这里，在生成的隐写图像中加入随机噪声(~N(0,0.01))以提高鲁棒性。G和E都进行了优化，尽量减少这种损失。

训练策略：

为了有效地训练GSN，依次对子网络𝐺、𝐷、𝑆和进行优化，如算法1所示。同时优化𝐺和E以提高秘密提取的准确性，其中应用了层次梯度衰减(HGD)技能(将在3.7节中介绍)来提高对隐写分析方法的抵抗力。分别用𝐿𝑜𝑠𝑠𝐺和𝐿𝑜𝑠𝑠E对G进行优化，主要是为了减少生成的载体/隐写图像之间的差异。真实图像只用于训练D。

生成器结构：

提取器结构：

隐写分析器和鉴别器：

如图所示，𝑆的输入是合成的载体图像和隐写图像，𝐷的输入是真实图像和合成的隐写图像(或载体图像，两者结果相似)。

数据集：CelebA和Lsun-bedroom数据集

评价指标：Frechet inception distance (Fid)、extraction accuracy (Acc)和detection error (Pe)分别评价生成的隐写图像的视觉质量、secret extraction的准确性和安全性。Fid越低，图像质量越好。Pe是评价隐写图像不可检出性的常用指标，Pe的取值范围为[0,1]，其最优值为0.5。当Pe = 0.5时，隐写分析工具无法区分图像的来源。