python中的哈希算法_使用openCV和Python实现图像哈希（hash）算法

最新推荐文章于 2023-02-28 11:18:28 发布

weixin_39975366

最新推荐文章于 2023-02-28 11:18:28 发布

阅读量1.5k

点赞数 1

文章标签： python中的哈希算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39975366/article/details/111429640

版权

本文介绍了图像哈希算法中的感知哈希dHash，用于生成图像的“指纹”，以便比较图像的相似性。dHash通过计算相邻像素的差异，对图像进行灰度化、调整大小、计算差异和构建哈希值。算法适用于图像归类和快速查找相似图像，具有鲁棒性，对图像尺寸变化和亮度对比度调整有较好的适应性。

摘要由CSDN通过智能技术生成

之前介绍了许多图像比对的算法，这里再介绍一个算法，叫感知哈希算法：perceptual hash algorithm, 它的作用是对每张图像生成一个“指纹”字符串，然后比较不同图像的指纹。结构越接近，说明图像越相似。

哈希算法步骤图解

这个算法常用于图像整理，归类上，比如快速整理手机中的照片文件夹子。该算法的优点明显，相对于其它算法实现起来比较简单，且速度快，准确率高。

图像哈希或者叫感知哈希包括以下两个过程：

1)检查图像内容

2)构造基于图像内容唯一标识，即输入图像的哈希值

最典型的应用比如TinEye，就是一种采用反向图像搜索引擎。用户可以：

1)上传图像

2)然后TinEye给出类似图像的网址

接下来我们将讨论：

1)图像散列(为什么传统散列不起作用)

2)实现图像散列，特别是差异散列(dHash)

3)将图像散列应用于实际问题和数据集

为什么我们不能使用md5，sha-1等？

图2：

在此示例中，我获取输入图像并计算md5哈希值。然后我将图像调整为宽度为250像素而不是500像素，然后再次计算md5哈希值。即使图像的内容没有改变，哈希也是如此。

具有密码学或文件验证背景的读者可能想知道为什么不能使用md5或sha-1等。这里的问题在于加密散列算法的本质：更改文件中的单个位将导致不同的散列。这意味着如果我们改变输入图像中单个像素的颜色，最终会得到一个不同的校验和，而事实上对于我们在图像感知层面上根本不觉得有什么不同。也就是说这个微小的改变我们是无法觉察的。

图2中的例子就说明这个问题，只是改变图像的大小，其它不变，计算图像的md5哈希，结构哈希值发生变化。在图像哈希情况下，我们实际上希望类似的图像具有类似的哈希值。

该项目的测试图像哈希数据集

该项目的目标是：

1)两个图像目录，dataset和query

2)确定query目录中的图像哪些已经在dataset中，哪些没有

使用图像哈希，我们可以快速完成这个任务。

了解图像哈希和差异哈希

dHash算法只有四个步骤

步骤一：转换图像为灰度

图3：通过差异散列算法进行图像散列的第一步是将输入图像(左)转换为灰度(右)。

图像散列算法的第一步把输入图像转换成灰度并丢弃任何颜色信息。这样我们只需要检查一个通道，从而更快地散列图像，另外匹配相同但颜色空间略有变化的图像。无论出于何种原因，如果你对于颜色感兴趣，可以独立在每个通道上应用散列算法，然后在最后进行组合。

步骤二：调整大小

灰度图像后，把图像压缩到9 x 8像素，忽略纵横比。

最低0.47元/天解锁文章

weixin_39975366

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
python中的哈希算法_使用openCV和Python实现图像哈希（hash）算法

之前介绍了许多图像比对的算法，这里再介绍一个算法，叫感知哈希算法：perceptual hash algorithm, 它的作用是对每张图像生成一个“指纹”字符串，然后比较不同图像的指纹。结构越接近，说明图像越相似。哈希算法步骤图解这个算法常用于图像整理，归类上，比如快速整理手机中的照片文件夹子。该算法的优点明显，相对于其它算法实现起来比较简单，且速度快，准确率高。图像哈希或者叫感知哈希包括以下两...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。