用python实现通过哈希算法检测图片重复_【5分钟实例】去除大量图片中重复的图片...

在紧急情况下,使用Python的图像处理模块和感知哈希算法(aHash)来检测并删除大量图片中的重复照片。通过计算图片的aHash值,并设置汉明距离阈值,避免微小差异导致的误判。同时,脚本还能过滤掉损坏或非图片文件,确保结果准确。通过实验验证了方法的可靠性。
摘要由CSDN通过智能技术生成

933e80912a7d61d67ebd0961f4396ebd.png

需求假设:你的老板给你上万张候选人的证件照,但是由于某些原因,一部分人的照片有不止一张(重复了),让你把重复出现的照片删掉,下班之前整理好发给他。你一看表距离下班只剩5分钟了,加班是不可能加班的。

20580d0069538c68eff3b7f9c4b93063.png

这时候你灵光一现,想起了python有图像处理模块

拿起键盘打开你最爱的IDE二话不说首先import以下必定要用到的库

import cv2import numpy as npimport os

别急,这种任务网上肯定是有现成轮子的,直接借鉴就好。对于图像去重,主要思路有,md5比较法和感知哈希法。其中md5比较法的鲁棒性稍微低了点,有时候图片因为多次压制或其他因素导致md5变化,从而图片看起来一样,但是会被判做不同图片。

感知哈希算法是比较常用的方法,在硬币分类检测时老潘也尝试过,但是并不适用于那个场景。但是今天的场景是绝对适合的。其中感知哈希算法

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值