以图搜图系统工程实践
之前写过一篇概述: 以图搜图系统概述 。
以图搜图系统需要解决的主要问题是:
提取图像特征向量(用特征向量去表示一幅图像)
特征向量的相似度计算(寻找内容相似的图像)
对应的工程实践,具体为:
卷积神经网络 CNN 提取图像特征
向量搜索引擎 Milvus
CNN
使用卷积神经网路 CNN 去提取图像特征是一种主流的方案,具体的模型则可以使用 VGG16 ,技术实现上则使用 Keras + TensorFlow ,参考 Keras 官方示例:
from keras.applications.vgg16 import VGG16
from keras.preprocessing import image
from keras.applications.vgg16 import preprocess_input
import numpy as np
model = VGG16(weights='imagenet', include_top=False)
img_path = 'elephant.jpg'
img = image.load_img(img_path, target_size=(224, 224))
x = image.img_to_array(img)
x = np.expand_dims(x, axis=0)
x = preprocess_input(x)
features = model.predict(x)
这里提取出来的 feature 就是特性向量。
1、归一化
为了方便后续操作,我们常常会将 feature 进行归一化的处理:
from numpy import linalg as LA
norm_feat = feat[0]/LA.norm(feat[0])
后续实际使用的也是归一化后的 norm_feat 。
2、Image 说明
这里加载图像使用的是 keras.preprocessing 的 image.load_img 方法即:
from keras.preprocessing import image
img_path = 'elephant.jpg'
img = image.load_img(img_path, target_size=