哈希
Hash,一般翻译做散列、杂凑,或音译为哈希,是把任意长度的输入(又叫做预映射pre-image)通过散列算法变换成固定长度的输出,该输出就是散列值。这种转换是一种压缩映射,也就是,散列值的空间通常远小于输入的空间,不同的输入可能会散列成相同的输出,所以不可能从散列值来确定唯一的输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
中文摘要
多媒体哈希是从多媒体中提取出来的、基于内容的一种简洁表示。通过多媒体哈希算法可将任意的多媒体数据映射成一串短小的哈希序列。在实际应用中,用哈希序列来代表多媒体本身,能够有效降低多媒体数据的存储代价和多媒体相似计算的复杂度。一般而言,多媒体哈希必须满足两个基本条件,即鲁棒性和唯一性。鲁棒性指是即使两个多媒体的具体数据表示不同,如果它们在视觉上相同,那么它们应该具有相同或非常相似的哈希。换言之,多媒体哈希需要具备对抗正常数字操作的能力,例如数据压缩和几何变换等。而唯一性则要求不同的多媒体应该有不同的哈希,这意味着不同多媒体的哈希之间的距离应该足够大。此外,多媒体哈希在一些实际应用中可能还需要具备其他的特性。例如,在多媒体内容认证中,多媒体哈希的提取需要密钥来控制并且多媒体哈希需要对内容变化敏感。
基于 TD 的图像哈希算法,通过从图像中构造张量,将张量分解应用于图像哈希提取。为了提高 TD 哈希算法的鲁棒性,先从规格化的图像中构造出一个稳定的 3 阶张量,然后运用一种名叫 Tucker 分解的张量分解方法将 3 阶张量分解成 1 核心张量和 3 个正交因子矩阵。由于因子矩阵可以反映原始张量的内在结构,因此 TD 哈希算法利用因子矩阵来构造哈希序列,确保算法具有较好的唯一性。
本章算法的主要贡献总结如下:
(1)通过构造一个稳定的3阶张量来代表输入图像,从张量中提取简短的表达来构造哈希。由于规格化图像能够减轻数字处理操作对输入图像的干扰,因此用规格化的图像来构造稳定的张量,有效的提高了 TD 哈希的鲁棒性。
(2)Tucker 分解是一种经典的张量分解方法,它将一个3阶张量分解成一个核心张量和3个正交的因子矩阵的形式。分解后的因子矩阵能够有效的反映原始张量的拓扑结构,因此采用因子矩阵来构造图像哈希能为 TD 哈希提供良好的唯一性。
(3)实验总共采用14551幅图像来验证 TD 哈希算法的性能,其中13213幅图像用于验证鲁棒性,1338幅图像作为唯一性的验证。在接收机操作特性曲线(ROC)图上评估本章算法与一些文献的图像哈希算法的性能,实验结果表明 TD 哈希算法在鲁棒性和唯一性的分类能力上要优于这些算法。
算法步骤
首先,输入图像经过一系列操作转换成规格化的图像;
然后,规格化图像经过分块之后,将它们构造成随机的3阶张量;
最后,通过对3阶张量进行张量分解来构造简短的图像哈希。
预处理
构造张量
张量分解
计算图像哈希相似性
实验
摘要
本文提出了一种新的图像哈希,它是用张量分解(TD)设计的,称为TD哈希,其中图像哈希的生成被视为从张量推导出一个紧凑的表示。