sklearn tfidf求余弦相似度_计算两图的相似性（以图搜图）

最新推荐文章于 2023-11-12 21:17:14 发布

weixin_39888943

最新推荐文章于 2023-11-12 21:17:14 发布

阅读量710

点赞数 1

文章标签： sklearn tfidf求余弦相似度

本文链接：https://blog.csdn.net/weixin_39888943/article/details/111581467

版权

语言：python

1.余弦相似度计算

把图片表示成一个向量，通过计算向量之间的余弦距离来表征两张图片的相似度。

# -*- coding: utf-8 -*-
# !/usr/bin/env python
# 余弦相似度计算
from PIL import Image
from numpy import average, dot, linalg
# 对图片进行统一化处理
def get_thum(image, size=(64, 64), greyscale=False):
    # 利用image对图像大小重新设置, Image.ANTIALIAS为高质量的
    image = image.resize(size, Image.ANTIALIAS)
    if greyscale:
        # 将图片转换为L模式，其为灰度图，其每个像素用8个bit表示
        image = image.convert('L')
    return image
# 计算图片的余弦距离
def image_similarity_vectors_via_numpy(image1, image2):
    image1 = get_thum(image1)
    image2 = get_thum(image2)
    images = [image1, image2]
    vectors = []
    norms = []
    for image in images:
        vector = []
        for pixel_tuple in image.getdata():
            vector.append(average(pixel_tuple))
        vectors.append(vector)
        # linalg=linear（线性）+algebra（代数），norm则表示范数
        # 求图片的范数
        norms.append(linalg.norm(vector, 2))
    a, b = vectors
    a_norm, b_norm = norms
    # dot返回的是点积，对二维数组（矩阵）进行计算
    res = dot(a / a_norm, b / b_norm)
    return res
image1 = Image.open('010.jpg')
image2 = Image.open('011.jpg')
cosin = image_similarity_vectors_via_numpy(image1, image2)
print('图片余弦相似度', cosin)

2.哈希算法计算图片的相似度

感知哈希算法是一类算法的总称，包括aHash、pHash、dHash。顾名思义，感知哈希不是以严格的方式计算Hash值，而是以更加相对的方式计算哈希值，因为“相似”与否，就是一种相对的判定。

几种hash值的比较：

aHash：平均值哈希。速度比较快，但是常常不太精确。
pHash：感知哈希。精确度比较高，但是速度方面较差一些。
dHash：差异值哈希。精确度较高，且速度也非常快

值哈希算法、差值哈希算法和感知哈希算法都是值越小，相似度越高，取值为0-64，即汉明距离中，64位的hash值有多少不同。三直方图和单通道直方图的值为0-1，值越大，相似度越高。

import cv2
import numpy as np
from PIL import I

最低0.47元/天解锁文章

weixin_39888943

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
sklearn tfidf求余弦相似度_计算两图的相似性（以图搜图）

语言：python1.余弦相似度计算把图片表示成一个向量，通过计算向量之间的余弦距离来表征两张图片的相似度。# -*- coding: utf-8 -*-# !/usr/bin/env python# 余弦相似度计算from PIL import Imagefrom numpy import average, dot, linalg# 对图片进行统一化处理def get_thum(im...
复制链接

扫一扫