1.图像
准确度的考量即相似的度量,而相似性的描述一般用“距离”。当然相似性度量时必须全面考虑多方面的主客观因素,这里只针对常用的方法。
一般来说,图像是一个标准的矩形,有着宽度(width)和高度(height),如果加上色彩RGB维度,立体的理解可看成三维坐标里的“点”,上述的“距离”就更好理解了。
2.相似度量
视觉特征测度空间度量、语义非测度空间度量和相似融合度量。
-
低层视觉特征测度空间度量: 图像的视觉特征是用客观的数值特征向量表示,相似度计算一般采用测度空间,满足测度空间非负性、对称性、以及三角不等式的准则。常用的相似性测量方法有:
麦考斯基(Minkowsky)距离: D ( x , y ) = ( ∑ i = 1 m ∣ x i − y i ∣ p ) 1 / p D(x, y)=\left(\sum_{i=1}^{m}\left|x_{i}-y_{i}\right|^{p}\right)^{1 / p} D(x,y)=(∑i=1m∣xi−yi∣p)1/p
欧氏(Euclidean)距离: D ( x , y ) = ∑ i = 1 m ( x i − y i ) 2 D(x, y)=\sqrt{\sum_{i=1}^{m}\left(x_{i}-y_{i}\right)^{2}} D(x,y)=∑i=1m(xi−yi)2
曼哈顿(Manhattan 或 city-block)距离: D ( x , y ) = ∑ i = 1 m ∣ x i − y i ∣ D(x, y)=\sum_{i=1}^{m}\left|x_{i}-y_{i}\right| D(x,y)=∑i=1m∣xi−yi∣
堪培拉(Canberra)距离: D ( x , y ) = ∑ i = 1 m ∣ x i − y i x i + y i ∣ D(x, y)=\sum_{i=1}^{m}\left|\frac{x_{i}-y_{i}}{x_{i}+y_{i}}\right| D(x,y)=∑i=1m∣∣∣xi+yixi−yi∣∣∣
切比雪夫(Chebychev)距离: D ( x , y ) = max 1 ≤ i ≤ m ∣ x i − y i ∣ D(x, y)=\max _{1 \leq i \leq m}\left|x_{i}-y_{i}\right| D(x,y)=max1≤i≤m∣xi−yi∣ -
高层语义非测度空间度量: 视觉特征测度空间度量是基于测量空间直接特征描述,而非语义层面理解。语义相似度的计算方法大致可分为三类:
路径长度方法:用关联知识库中连接两个概念的路径长度来推测实例间的语义相似度;
信息论方法:根据概念之间的信息量关系,推导概念之间的相似度;
基于概念特征方法:通过比较概念具有特定属性的属性值,判断概念之间的相似性。 -
相似度融合度量: 将低层视觉特征和高层语义的相似度线性加权。
sim ( Q , D ) = w t × sim ( Q t , D t ) + w v × sim ( Q v , D v ) \operatorname{sim}(Q, D)=w_{t} \times \operatorname{sim}\left(Q_{t}, D_{t}\right)+w_{v} \times \operatorname{sim}\left(Q_{v}, D_{v}\right) sim(Q,D)=wt×sim(Qt,Dt)+wv×sim(Qv,Dv)
调节权重wt和wv的值来调整视觉特征相似度和文本语义相似度在图像整体语义相似度量中的重要程度。 图像集合的语义特征越相近,视觉特征相似度的区分能力越显著,图像集合的语义越纷繁多样,文本语义相似度的区分能力越显著。
3.检索性能的评价
图像检索性能的评价准则需要考虑灵活性、有效性和效率三个因素。灵活性评估图像检索算法的适应性;有效性评估检索到的图像和查询图像的合格率;效率用于评估图像检索算法的速度。
通常用查全率(Recall)和查准率(Precision)来衡量检索性能。
查全率: 图像的检索结果中相关图像数与图像库中图像总数的比值。
Re call
=
a
a
+
c
=\frac{a}{a+c}
=a+ca
查准率: 相关图像的数量与检索图像总数的比值。
Precision
=
a
a
+
b
=\frac{a}{a+b}
=a+ba
a为检索结果中与示例图像相关的图像数量,b为检索结果中与示例图像无关的图像数量,c是没有检索出来的相关图像数量。