阿里巴巴公司通过截图,根据肉眼无法识别的标识码追踪到泄露信息的具体员工……
阿里月饼事件中的新闻中提到“泄露内部信息丢了工作,因为截图上「看不见的水印」”。那么该技术(简称“阿里水印”)的原理是什么?又能否利用Python实现呢。
1. 原理
传统的水印,是将水印直接叠加在图像上。但由于水印可见,那么通过PS等方式去除水印就很容易做到。
而阿里水印的关键,在于水印的隐藏。实际上,是把水印添加到了频域中。
频域添加数字水印的方法,是指通过某种变换手段(傅里叶变换,离散余弦变换,小波变换等)将图像变换到频域(小波域),在频域对图像添加水印,再通过逆变换,将图像转换为空间域。相对于空域手段,频域手段隐匿性更强,抗攻击性更高。
上图为叠加数字盲水印的基本流程。编码的目的有二:
一是对水印加密
二控制水印能量的分布
2. 鲁棒性: 对抗水印攻击
所谓对水印的攻击,是指破坏水印,包括涂抹,剪切,放缩,旋转,压缩,加噪,滤波等。数字盲水印不仅仅要敏捷性高(不被人抓到),也要防御性强(抗打)。
注意:数字盲水印的隐匿性和鲁棒性是互斥的。
3. Python实现
3.1. 原始图像读取
这里以Doc为例:
# %%
im = mvlib.io.imread("test/doc.png")
uu.imshow(im)
<