phash算法java实现_Java进阶(五十七)-基于感知哈希算法的pHash图像配准算法

最新推荐文章于 2024-08-11 20:38:34 发布

吹亚吹

最新推荐文章于 2024-08-11 20:38:34 发布

阅读量737

点赞数 2

文章标签： phash算法java实现

本文链接：https://blog.csdn.net/weixin_29359001/article/details/114246972

版权

本文介绍了基于感知哈希算法的pHash图像配准算法，通过缩小尺寸、简化色彩、计算DCT等步骤生成图像指纹，用于判断图片相似度。pHash通过保留图像的低频成分，能较好地识别图片的变形，适用于缩略图的匹配。文章提供了一个Java实现的DEMO，展示了如何计算两个图片的汉明距离，以此判断它们的相似度。

摘要由CSDN通过智能技术生成

Java进阶(五十七)-基于感知哈希算法的pHash图像配准算法

毕业论文提交之后，老师交给自己一项任务：图像配准，也就是给你两幅图像，通过系统来判定两幅图像是否为同一副图像。自己作为这一方面的小白，先去网上搜索一下相应的检测方法，当然有现成的API调用最好，花钱也无所谓。

我们这里采用的基础关键技术叫做 “感知哈希算法”(Perceptual hash algorithm)，它的作用是对每张图片生成一个”指纹”(fingerprint)字符串，然后比较不同图片的指纹。结果越接近，就说明图片越相似。

感知哈希算法

下面是一个最简单的实现：

第一步，缩小尺寸。

将图片缩小到8x8的尺寸，总共64个像素。这一步的作用是去除图片的细节，只保留结构、明暗等基本信息，摒弃不同尺寸、比例带来的图片差异。

第二步，简化色彩。

将缩小后的图片，转为64级灰度。也就是说，所有像素点总共只有64种颜色。

第三步，计算平均值。

计算所有64个像素的灰度平均值。

第四步，比较像素的灰度。

将每个像素的灰度，与平均值进行比较。大于或等于平均值，记为1；小于平均值，记为0。

第五步，计算哈希值。

将上一步的比较结果，组合在一起，就构成了一个64位的整数，这就是这张图片的指纹。组合的次序并不重要，只要保证所有图片都采用同样次序就行了。

得到指纹以后，就可以对比不同的图片，看看64位中有多少位是不一样的。在理论上，这等同于计算”汉明距离”(Hamming distance)。如果不相同的数据位不超过5，就说明两张图片很相似；如果大于10，就说明这是两张不同的图片。

具体的代码实现，可以参见Wote用Python语言写的imgHash.py。代码很短，只有53行。使用的时候，第一个参数是基准图片，第二个参数是用来比较的其他图片所在的目录，返回结果是两张图片之间不相同的数据位数量(汉明距离)。

这种算法的优点是简单快速，不受图片大小缩放的影响，缺点是图片的内容不能变更。如果在图片上加几个文字，它就认不出来了。所以，它的最佳用途是根据缩略图，找出原图。

实际应用中，往往采用更强大的pHash算法和SIFT算法，它们能够识别图片的变形。只要变形程度不超过25%，它们就能匹配原图。这些算法虽然更复杂，但是原理与上面的简便算法是一样的，就是先将图片转化成Hash字符串，然后再进行比较。

均值哈希虽然简单，但受均值的影响非常大。例如对图像进行伽马校正或直方图均衡就会影响均值，从而影响最终的hash值。存在一个更健壮的算法叫pHash。它将均值的方法发挥到极致。使用离散余弦变换(DCT)来获取图片的低频成分。

离散余弦变换(DCT)是种图像压缩算法，它将图像从像素域变换到频率域。然后一般图像都存在很多冗余和相关性的，所以转换到频率域之后，只有很少的一部分频率分量的系数才不为0，大部分系数都为0(或者说接近于0)。

pHash

pHash的工作过程如下：

(1)缩小尺寸：pHash以小图片开始，但图片大于8*8，32*32是最好的。这样做的目的是简化了DCT的计算，而不是减小频率。

(2)简化色彩：将图片转化成灰度图像，进一步简化计算量。

(3)计算DCT：计算图片的DCT变换，得到32*32的DCT系数矩阵。

(4)缩小DCT：虽然DCT的结果是32*32大小的矩阵，但我们只要保留左上角的8*8的矩阵，这部分呈现了图片中的最低频率。

(5)计算平均值：如同均值哈希一样，计算DCT的均值。

(6)计算hash值：这是最主要的一步，根据8*8的DCT矩阵，设置0或1的64位的hash值，大于等于DCT均值的设为”1”，小于DCT均值的设为“0”。组合在一起，就构成了一个64位的整数，这就是这张图片的指纹。

结果并不能告诉我们真实性的低频率，只能粗略地告诉我们相对于平均值频率的相对比例。只要图片的整体结构保持不变，hash结果

关注