图像检索的准确度由什么判定?

1.图像

准确度的考量即相似的度量,而相似性的描述一般用“距离”。当然相似性度量时必须全面考虑多方面的主客观因素,这里只针对常用的方法。

一般来说,图像是一个标准的矩形,有着宽度(width)和高度(height),如果加上色彩RGB维度,立体的理解可看成三维坐标里的“点”,上述的“距离”就更好理解了。
在这里插入图片描述在这里插入图片描述

2.相似度量

视觉特征测度空间度量、语义非测度空间度量和相似融合度量。

  1. 低层视觉特征测度空间度量: 图像的视觉特征是用客观的数值特征向量表示,相似度计算一般采用测度空间,满足测度空间非负性、对称性、以及三角不等式的准则。常用的相似性测量方法有:
    麦考斯基(Minkowsky)距离: D ( x , y ) = ( ∑ i = 1 m ∣ x i − y i ∣ p ) 1 / p D(x, y)=\left(\sum_{i=1}^{m}\left|x_{i}-y_{i}\right|^{p}\right)^{1 / p} D(x,y)=(i=1mxiyip)1/p
    欧氏(Euclidean)距离: D ( x , y ) = ∑ i = 1 m ( x i − y i ) 2 D(x, y)=\sqrt{\sum_{i=1}^{m}\left(x_{i}-y_{i}\right)^{2}} D(x,y)=i=1m(xiyi)2
    曼哈顿(Manhattan 或 city-block)距离: D ( x , y ) = ∑ i = 1 m ∣ x i − y i ∣ D(x, y)=\sum_{i=1}^{m}\left|x_{i}-y_{i}\right| D(x,y)=i=1mxiyi
    堪培拉(Canberra)距离: D ( x , y ) = ∑ i = 1 m ∣ x i − y i x i + y i ∣ D(x, y)=\sum_{i=1}^{m}\left|\frac{x_{i}-y_{i}}{x_{i}+y_{i}}\right| D(x,y)=i=1mxi+yixiyi
    切比雪夫(Chebychev)距离: D ( x , y ) = max ⁡ 1 ≤ i ≤ m ∣ x i − y i ∣ D(x, y)=\max _{1 \leq i \leq m}\left|x_{i}-y_{i}\right| D(x,y)=max1imxiyi

  2. 高层语义非测度空间度量: 视觉特征测度空间度量是基于测量空间直接特征描述,而非语义层面理解。语义相似度的计算方法大致可分为三类:
    路径长度方法:用关联知识库中连接两个概念的路径长度来推测实例间的语义相似度;
    信息论方法:根据概念之间的信息量关系,推导概念之间的相似度;
    基于概念特征方法:通过比较概念具有特定属性的属性值,判断概念之间的相似性。

  3. 相似度融合度量: 将低层视觉特征和高层语义的相似度线性加权。
    sim ⁡ ( Q , D ) = w t × sim ⁡ ( Q t , D t ) + w v × sim ⁡ ( Q v , D v ) \operatorname{sim}(Q, D)=w_{t} \times \operatorname{sim}\left(Q_{t}, D_{t}\right)+w_{v} \times \operatorname{sim}\left(Q_{v}, D_{v}\right) sim(Q,D)=wt×sim(Qt,Dt)+wv×sim(Qv,Dv)
    调节权重wt和wv的值来调整视觉特征相似度和文本语义相似度在图像整体语义相似度量中的重要程度。 图像集合的语义特征越相近,视觉特征相似度的区分能力越显著,图像集合的语义越纷繁多样,文本语义相似度的区分能力越显著。

3.检索性能的评价

图像检索性能的评价准则需要考虑灵活性、有效性和效率三个因素。灵活性评估图像检索算法的适应性;有效性评估检索到的图像和查询图像的合格率;效率用于评估图像检索算法的速度。
通常用查全率(Recall)和查准率(Precision)来衡量检索性能。
查全率: 图像的检索结果中相关图像数与图像库中图像总数的比值。
Re call = a a + c =\frac{a}{a+c} =a+ca
查准率: 相关图像的数量与检索图像总数的比值。
Precision = a a + b =\frac{a}{a+b} =a+ba
a为检索结果中与示例图像相关的图像数量,b为检索结果中与示例图像无关的图像数量,c是没有检索出来的相关图像数量。

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 基于神经网络的图像检索方法是近年来图像检索领域的研究热点之一。该方法利用深度学习技术构建神经网络模型,通过学习图像的特征表示,实现图像之间的相似性匹配和检索。 目前,基于神经网络的图像检索方法主要包括两个方面的研究。第一是特征提取,即通过神经网络模型学习图像的高层抽象特征。传统的图像特征提取方法,如SIFT、HOG等,往往需要手动设计特征提取算法,效果有限。而基于神经网络的图像特征提取方法,如VGGNet、ResNet等,可以自动学习图像的特征表示,具有更好的性能。第二是相似性匹配,即利用学习到的特征表示计算图像之间的相似度,并进行图像检索。基于神经网络的图像相似性匹配方法,如Siamese网络、Triplet网络等,能够准确地度量不同图像之间的相似度。 在实际应用中,基于神经网络的图像检索方法已经取得了广泛的应用。例如,基于深度学习的图像搜索引擎可以根据用户输入的关键词,检索和显示相关的图像。此外,在安全监控、人脸识别等领域,基于神经网络的图像检索方法也被广泛应用。 总的来说,基于神经网络的图像检索方法在深度学习的推动下,取得了显著的研究进展和应用成果。然而,该领域仍然存在一些挑战,如大规模图像检索的效率问题、与语义理解的融合等。随着深度学习技术的不断发展,相信基于神经网络的图像检索方法将在未来取得更多突破和应用价值。 ### 回答2: 基于神经网络的图像检索方法是当前计算机视觉领域的热点研究方向之一。这种方法通过将图像映射到低维特征空间中,然后使用相似性度量方法进行检索。 目前,研究者们提出了许多基于神经网络的图像检索方法。其中一种常见的方法是使用卷积神经网络(CNN)提取图像的特征。CNN是一种具有多层卷积和池化操作的神经网络,可以有效地提取图像的局部和全局特征。通过训练CNN,我们可以得到具有语义信息的图像特征向量。 除了使用CNN提取图像特征之外,还有一些研究工作探索了使用生成对抗网络(GAN)生成图像特征。GAN是由生成器和判别器组成的对抗性模型,可以生成逼真的图像。通过在GAN中训练生成器,我们可以得到与真实图像特征相似的虚假图像特征,这可以提供更多样的图像表示。 此外,近年来,一些研究工作开始关注将多模态信息结合在一起进行图像检索。这些方法使用多个神经网络分别提取图像的视觉特征和文本特征,并将它们融合在一起,以获得更加全面和准确的图像检索结果。 总结来说,基于神经网络的图像检索方法在研究和应用上取得了很大的进展。未来的研究方向可能包括改进网络结构、增加多模态信息的融合能力,以及进一步提高检索效果和效率。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值