![2184c808e6e27c2c9e70fadf2c220e3b.png](https://i-blog.csdnimg.cn/blog_migrate/229b680b536d827f2145e59983ccc282.jpeg)
论文信息
论文标题:High Capacity Lossless Data Hiding in JPEG Bitstream Based on General VLC Mapping
作者:杜洋,殷赵霞*,张新鹏
期刊:IEEE Transactions on Dependable and Secure Computing
文章链接:https://ieeexplore.ieee.org/abstract/document/9153896
论文摘要
作为可逆信息隐藏技术的一个分支,无损信息隐藏 (Lossless Data Hiding, RDH)技术尤其重要。因为无损信息隐藏技术不仅可以无损地恢复载体图像,还不会对载密图像的视觉质量带来任何失真。
本文基于通用变长编码映射 (General Variable Length Code Mapping, GVM)提出了一种新的适用于JPEG图像的无损信息隐藏方案。
在该方案中,首先对AC系数的中间编码形式Run/Size值进行重排序操作。然后根据给定载荷确定可行解空间的大小。基于JPEG编码特点,建立了模拟嵌入模型来从可行解空间中找到最优解。根据得到的最优解,建立VLC之间的最优映射关系,进一步地修改文件头中的Huffman表来实现无损嵌入的前提。最终,通过把原始的VLC用映射集中的VLC进行替换以实现秘密信息的嵌入。
实验结果表明对于大部分的JPEG图像,使用本方案产生的文件大小膨胀量低于之前的JPEG可逆信息隐藏方案。与此同时,生成的载密图像并没有视觉失真,不仅如此,本方案可以获得更高的嵌入容量。
贡献/亮点
- 本文尝试了使用通用VLC映射策略来设计无损信息隐藏方案,即允许同一个映射集中的变长编码长度不必相同。而在此之前,无损信息隐藏方案都是基于同个映射集中编码长度必须保持一致来进行设计。
- 本文设计的基于GVM的新无损信息隐藏方案实现了优于基于直方图平移(Histogram Shifting, HS)的RDH方案的文件大小保持的性能。并且生成的载密图像视觉质量与载体图像完全一致,即无损。
研究背景
可逆信息隐藏(Reversible Data Hiding, RDH)技术是一种可以将秘密信息以特定的不易感知的方式嵌入到数字媒体中同时在提取秘密信息时可以完整恢复原来的数字媒体的技术。
JPEG图像在互联网中被广泛使用,而目前基于JPEG图像的RDH研究还远远不够。根据修改的位置不同,本文将目前JPEG-RDH方案分为两类。一类是基于DCT系数修改的方案,一类是基于VLC修改的方案。
在JPEG-RDH技术的研究中,有三类评价指标或者说优化目标:视觉质量,嵌入容量以及文件大小保持能力。
对于基于VLC修改的方案,视觉质量无损,因此只需要考虑嵌入容量和文件大小保持能力即可。而对于基于DCT系数修改的方案来说,对于视觉质量的影响不容忽视。但视觉质量和文件大小保持之间的优化存在trade-off。
因此,设计基于VLC修改的LDH技术相对来说可以更简单地实现更好的性能。
![f47f00bc1f5aff1aaf297e6c0b75b533.png](https://i-blog.csdnimg.cn/blog_migrate/4a11abc8ec91b229f8fc2f60de695984.jpeg)
然而,目前已有的一些基于VLC修改的LDH方案所能实现的嵌入容量与基于DCT的方案相比十分有限。这也限制了其应用前景。
其低嵌入容量的原因在于其基于码长分组建立映射关系。也就是说,构造映射集时,只将相同的VLC置于同组集合,不同长度的VLC不允许建立映射关系。由于JPEG压缩算法的特性,往往码长较长的VLC更有可能构造映射关系,而其出现次数相较短码太少,导致了低嵌入容量。
![bca3d07b8a76503f55600fb5277cc160.png](https://i-blog.csdnimg.cn/blog_migrate/c5729b6a7caec22c7f6e54e05c655210.jpeg)
为此, 在本文中,我们遵循不限于码长的映射策略,即通用VLC映射策略来设计无损信息隐藏方案。
所提方法
确定不限于码长来进行映射之后,关键问题在于, 如何确定给不同频率的VLC分配不同数量的未使用VLC以尽可能实现最优?换句话说,如何在一定的约束下找到最优的参数组合?这样说就很容易看出,其实我们要解决的是一个组合优化问题。
1. RSV 重排序
对于每一个输入的JPEG图像,统计其频率分布,并将其RSV进行重排序操作。这一步操作可以移除图像中因采用默认Huffman表而存在的一定编码冗余。重排序也可以看作是一个初始化操作。
![f07eaabe48f5fe3047bc0cde4d414642.png](https://i-blog.csdnimg.cn/blog_migrate/6a81240a3f113644bf3d94e970f5195d.png)
![c891c6eab9b6f91a1ec9096a219e57ea.png](https://i-blog.csdnimg.cn/blog_migrate/b8648b314ebf99b976c4b74ea2ccfbae.png)
2. 映射关系构造
重排序之后,以给定的载荷及其他设置作为约束条件,我们可以得到可行解空间。 一个解就是包含了所有给已使用VLC分配的未使用VLC的数量的组合。
我们的目标就是获得最优解, 即综合性能最优的数量组合。在本文中,我们建立了一个模拟嵌入模型来估计实际嵌入时的文件大小改变情况。这样不需要实际嵌入就可以评估当前解的性能,从而提高求解效率。
模拟嵌入分为两个子过程: 平移和嵌入:
![47bd876e73789da70aa8862a04931a0d.png](https://i-blog.csdnimg.cn/blog_migrate/6cf773c18e51c5b505b4c9636933e68b.png)
![b64f255508b67ea3ed20d512fdc0ae21.png](https://i-blog.csdnimg.cn/blog_migrate/cdf4e033434c0a3d5eeaa9c64080c218.png)
根据模拟嵌入模型,我们最终就可以计算当前可行解的模拟文件大小增量(Simulated File-size Increment, SFI):
![73c2782d0adfd24475562040bbd2a7f5.png](https://i-blog.csdnimg.cn/blog_migrate/ecf6fdea858ccfa7a574aa7716d11a03.png)
根据模拟文件大小增量公式就可以对每个可行解进行评估从而找到解空间中的最优解。
![41f6792e246280fba3f8fbc7eb4b5548.png](https://i-blog.csdnimg.cn/blog_migrate/c11249ae8ba251654af875e4dcb8cb48.jpeg)
3. 秘密信息嵌入
在找到最优解之后,就可以据此建立最优映射关系,从而指导最终的秘密信息嵌入。
![a112e0071e380c1c956e67f244fae78d.png](https://i-blog.csdnimg.cn/blog_migrate/284ab8fc190cbd64e75784839e4225da.jpeg)
部分实验数据
![ccd8086ddc3034ea759885aa09cd348c.png](https://i-blog.csdnimg.cn/blog_migrate/c2a48487bb46d5a2f468ab1aa0f184cc.jpeg)
![80422bb599738c54b57e9431c53002f1.png](https://i-blog.csdnimg.cn/blog_migrate/9ebd383874c04480a7bc7d84d2fb1c80.jpeg)
![794fa25a85e932cf10a47a204d2c660a.png](https://i-blog.csdnimg.cn/blog_migrate/d2f0a1972e2907b0bb00a380e7cab1c6.jpeg)
结论
本文通过构造最优的通用VLC映射关系,提出了一种大容量JPEG无损信息隐藏方案。实验结果验证了该方案的优越性。
但同时仍存在一些不可忽视的问题。如,本方案只适用于使用默认Huffman表压缩的JPEG图像。即使这类图像在JPEG图像中有相当一部分的占比,也说明了本方案的适用性有限。其次,本方案中寻找最优解的算法的效率还有待优化。