以图搜图系统概述
以图搜图指的是根据图像内容搜索出相似内容的图像。
构建一个以图搜图系统需要解决两个最关键的问题:首先,提取图像特征;其次,特征数据搜索引擎,即特征数据构建成数据库并提供相似性搜索的功能。
图像特征表示
介绍三种方式。
图像哈希
图像通过一系列的变换和处理最终得到的一组哈希值称之为图像的哈希值,而中间的变换和处理过程则称之为哈希算法。
图像的哈希值是对这张图像的整体抽象表示。
比如 Average Hash 算法的计算过程:
- Reduce size : 将原图压缩到 8 x 8 即 64 像素大小,忽略细节。
- Reduce color : 灰度处理得到 64 级灰度图像。
- Average the colors : 计算 64 级灰度均值。
- Compute the bits : 二值化处理,将每个像素与上一步均值比较并分别记为 0 或者 1 。
- Construct the ha