python 实现感知哈希算法

一、感知哈希算法介绍

感知哈希算法(Perceptual Hash Algorithm,简称PHA)是哈希算法的一类,主要用于相似图片的搜索工作。PHA通过提取图片中的特征来生成一组指纹(虽然不是唯一的),这些指纹可以进行比较。具体来说,算法会将比较结果组合成一个64位的整数,作为图片的指纹。指纹的生成次序并不重要,只要保证所有图片都采用同样的次序即可(例如,自左到右、自顶向下、big-endian)。

在得到指纹后,可以对比不同的图片,看看64位中有多少位是不一样的。这等同于计算“汉明距离”(Hamming distance)。如果不相同的数据位不超过5,就说明两张图片很相似;如果大于10,就说明这是两张不同的图片。

感知哈希算法具有一些重要的特性,比如无论改变图片的高宽、亮度甚至颜色,都不会改变其哈希值。此外,感知哈希算法还包括多种具体的实现方式,如均值哈希(aHash)、感知哈希(pHash)和dHash(差异值哈希)等。这些算法各有特点,如aHash速度较快但精确度较低,pHash精确度较高但速度较慢,而dHash则兼顾了速度和精确度。

在得到64位hash值后,使用汉明距离来量化两张图像的相似性。汉明距离越大,图像的相似度越小;汉明距离越小,图像的相似度越大。这种算法在“以图搜图”的引擎中有广泛应用,如Google和Tineye就主要利用这种算法进行图像检索。

总的来说,感知哈希算法是一种有效的图像检索工具,能够通过比较图像的指纹来快速判断图像的相似性。然而,它也有一些局限性,比如对旋转的鲁棒性较差,需要在实际应用中根据具体情况进行改进和优化。

二、算法实现样例

下面是一个Python实现的感知哈希算法的示例:

import cv2
import numpy as np


def perceptual_hash(image, hash_size=8):
    # 缩放图片尺寸为8x8
    img = cv2.resize(image, (hash_size, hash_size))

    # 转换为灰度图像
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

    # 计算DCT变换
    dct = cv2.dct(np.float32(gray))

    # 保留左上角8x8区域的低频成分
    dct_low_freq = dct[:hash_size, :hash_size]

    # 计算均值(去掉直流分量)
    avg = np.mean(dct_low_freq)

    # 根据均值计算哈希值
    hash_code = ""
    for i in range(hash_size):
        for j in range(hash_size):
            hash_code += "1" if dct_low_freq[i, j] > avg else "0"

    return hash_code


def hamming_distance(hash1, hash2):
    # 计算汉明距离
    distance = 0
    for bit1, bit2 in zip(hash1, hash2):
        if bit1 != bit2:
            distance += 1

    return distance


# 读取两张图片
image1 = cv2.imread("image1.jpg")
image2 = cv2.imread("image2.jpg")

# 计算感知哈希值
hash1 = perceptual_hash(image1)
hash2 = perceptual_hash(image2)

# 计算汉明距离
distance = hamming_distance(hash1, hash2)

print("Hamming Distance:", distance)

在上面的示例中,perceptual_hash函数使用OpenCV库进行图像处理,将RGB图像转换为灰度图像,并计算DCT变换。然后,根据DCT变换结果的均值,产生一个8x8的哈希码。hamming_distance函数计算两个哈希码之间的汉明距离。

你可以将"image1.jpg"和"image2.jpg"替换为你自己的图片路径,然后运行代码,即可得到两张图片的汉明距离。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

luthane

您的鼓励将是我创作最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值