写在前面
水印作为一种保护版权的有效方式被广泛地应用于海量的互联网图像,针对水印的各种处理显得越来越重要。在之前的两篇文章《AI技术在图像水印处理中的应用》和《生成对抗网络玩转图像水印》中,已经介绍了当前利用深度神经网络来实现水印的检测和去除的一些研究。
基于深度学习的水印处理需要海量水印图像作为数据基础。然而现实中并没有直接可以使用的水印图像数据,为此制作了首个大规模水印图像数据集(Large-scale Visible Watermark dataset, LVW)用于学术研究。为了更好地方便大家的学习和使用,LVW数据集已经开放下载【仅供学术研究,勿作他用】,希望能够为水印处理智能化的研究添砖加瓦。
数据集介绍
LVW数据集由6万张带水印图像组成,包含了80种来自于公司、组织和个人的水印,包括了中文、英文和logo等不同样式,每种水印对应750张图像。为了保证图像数据的一般性和可用性,公开的PASCAL VOC 2012数据集的图像被作为原始的无水印图像,然后将上述80种水印以随机的大小、位置和透明度打在原始图像上,同时记录下水印的位置信息。