1.问题描述
工作中遇到一个问题,需要将一个待测图片与大量的图片库进行相似度计算,以求出最相近的类别。
2.解决方案
在解决方案中涉及到numpy向量的保存和图片预想相似度的计算:
先将图片库中所有图片的向量保存为一个n维向量,再保存入文件中,每次匹配读取该向量值,与待测图片向量做相似度运算,并直接获取最值。
3.具体步骤
(1)图片库中图片转为n维向量并保存到文件
假设我们图片库中有几种颜色不同的花(red/blue/black),每张图片缩放到固定尺寸后,三通道求均值然后展开形成向量。
(事实上主要依靠颜色来进行分辨的图像库直接将RGB三通道求均值再展开最后获得的余弦相似度并没有很大代表性,极大可能匹配错误,可以尝试按通道加权平均或者转成HSV色彩空间
)
#核心代码:
img_path = os.path.join(img_fold,filename)
img = cv2.imread(img_path)
#统一尺寸
img = cv2.resize(img,SIZE)
#图片转向量
img_temp = np.average(tmp_img