使用OpenCV,Phthon进行图像哈希处理的一个重要应用是去除重复的图像;
当你有多个相册的图片,进行合并时,so boring,有一些图片是重复的,肉眼来看太难删除了。
图像哈希可以帮助你完美的解决这个问题,找到完全相同的图片,只保留一张,删除其他的。
图像哈希(也称为感知哈希)是基于图像的视觉内容构造哈希值的过程。我们将图像哈希用于CBIR,近重复检测和反向图像搜索引擎。
1. 图像哈希的原理
(1)检查图像内容
(2)构造一个哈希值,该哈希值根据图像的内容唯一地标识输入图像
图像哈希的最重要的一个应用是:反向图像搜索引擎。
2. 为什么md5,sha-1不起作用?
将一张图片有250250缩放到500500,图像没有变化,但计算出来的md5值变了。原因在于:密码哈希算法的本质:更改文件中的单个位将导致不同的哈希。
在图像哈希/感知哈希情况下,我们实际上希望相似的图像也具有相似的哈希值。 这也是根本原因。
解决办法: 使用差分哈希(Difference Hash 简称dHash);
3. 差异哈希
(1)转为灰度图&#