04_yummy-CSDN博客

原创常用图像质量衡量指标（持续更新）

和。由于主观评估成本高且难以规模化，因此研究者开发了大量客观评估指标。这些指标在生成式模型（如GANs、扩散模型）、图像压缩、超分辨率、隐写术等任务中至关重要。

2025-08-27 11:40:05 452

原创《MDDM: Practical Message-Driven Generative Image Steganography Based on Diffusion Models》ICML 2025

实现可证明安全的图像隐写术是一项重大挑战。传统方法通常通过修改载体图像来嵌入秘密数据。这些方法往往会留下痕迹，容易被隐写分析工具检测到，因此被认为是经验上安全的，而非可证明安全的。近年来，图像隐写术的发展重点集中在提高隐蔽性增强安全性和提升抗攻击性上。下面介绍一下图像隐写术的几个方面。（具体没有深入了解）分类缺陷将信息直接嵌入图像中最古老且经典的嵌入型隐写方案是 LSB，它将信息嵌入图像像素的最低有效位。往往会在图像上留下修改痕迹，仍可能被检测到。

2025-08-27 09:50:09 962

原创《An Undetectable Watermark for Generative Image Models》ICLR 2025

本文提出了一种新型不可检测水印方案PRC，用于解决生成式图像模型的虚假信息传播问题。该方法通过伪随机纠错码在潜空间嵌入水印，既保持图像质量（FID/CLIP分数无下降），又具有高鲁棒性（抵抗JPEG压缩等10种攻击）。相比现有方案，PRC水印在不可检测性（分类器无法识别）、消息编码能力（可嵌入512-2500位信息）和多样性保持（LPIPS分数相当）方面表现更优，且无需额外训练。实验表明，该方法在Stable Diffusion 2.1上实现了质量与安全性的平衡，为AI内容溯源提供了有效解决方案。

2025-08-21 15:26:29 957

原创《Hidden in the Noise: Two-Stage Robust Watermarking for Images》ICLR 2025

《基于扩散模型初始噪声的两阶段鲁棒图像水印方法》提出WIND框架，通过伪随机初始噪声作为无失真水印，设计分组检索机制实现高效检测。实验表明，该方法在保持图像质量（FID=24.33）的同时，显著提升抗攻击能力（裁剪攻击准确率0.93），优于Tree-Ring等现有技术，并能有效抵御伪造/移除攻击。两阶段设计通过傅里叶模式嵌入组标识，将检测复杂度从O(N)降至O(N/M)，平衡了鲁棒性与效率。

2025-08-19 17:28:11 1183

原创《LaWa: Using Latent Space for In-Generation Image Watermarking》ECCV 2024

本文提出LaWa方法，一种专为潜在扩散模型设计的生成中图像水印技术。LaWa通过向LDM解码器注入可训练水印模块，在保持图像质量的同时实现隐形水印嵌入，无需修改模型主体结构。相比传统方法，LaWa在CLIC数据集上展现出优越性能：对32/48位水印均保持高视觉质量（LPIPS/SIFID最优），且在JPEG压缩、裁剪等攻击下比特准确率最高。实验表明，LaWa在生成中水印领域显著优于StableSignature等基准方法，同时对组合攻击具有更强鲁棒性。

2025-07-16 17:15:03 992

原创《SoK: How Robust is Audio Watermarking in Generative AI models?》2025

【摘要】本文系统研究了音频水印在生成式AI模型中的鲁棒性问题。通过建立包含22种方案的分类体系，评估了9种水印方案对3类攻击（信号级/物理级/AI诱导失真）的抵抗能力。实验表明：1）所有方案均易受音高偏移攻击；2）多数方案对时域修改敏感；3）仅Timbre方案表现相对稳定；4）物理重录和AI攻击（如TTS）严重损害水印有效性。研究发现现有水印技术尚无法提供可靠的版权保护，提出了扩展攻击场景、开发自适应水印等改进方向。

2025-07-08 10:46:07 640

原创《Jukebox: A Generative Model for Music》2020

内容缺陷/挑战性符号化方法低维空间中处理问题，如，以钢琴卷帘的形式象征性地生成音乐，指定每个要演奏的音符的时间、音高、力度和乐器。将生成的音乐限制在了特定的音符序列和固定的乐器组合范围内。非符号化方法，即直接生成音频形式的音乐直接生成音频形式的音乐。挑战性：①原始音频空间的维度极高，且需要建模的信息含量巨大。②直接对原始音频进行建模会引入极长的依赖关系，这使得学习音乐的高层语义在计算上颇具难度。——学习音频的低维编码。本文采用分层的VQ-VAE 架构将音频压缩到离散空间中，其损失函数旨在。

2025-07-08 10:45:13 797

原创《Gaussian Shading: Provable Performance-Lossless Image Watermarking for Diffusion Models》 CVPR 2024

《GaussianShading：扩散模型的无损性能图像水印方法》提出了一种创新水印技术，通过将水印信息映射到扩散模型的潜在空间，实现版权保护的同时保持生成质量。该方法采用水印扩散、随机化和分布保持采样三个关键技术，使含水印的潜在表示与原始高斯分布一致，确保生成性能不受影响。相比现有方法，其优势在于无需模型微调、即插即用、256位高水印容量，并具有理论可证明的无损性能。主要局限在于依赖DDIM反演方法和需要密钥管理。该研究为扩散模型的安全部署提供了有效解决方案。

2025-07-01 13:05:25 1115

原创《Latent Watermark: Inject and Detect Watermarks in Latent Diffusion Space》TM 2024

《Latent Watermark: Inject and Detect Watermarks in Latent Diffusion Space》TM 2024

2025-06-30 18:30:40 731

Echo1104_yummy的博客