3.WUP改善标注结果
3.1 wup方法
WordNet[20]是著名的数据库之一,可以用来计算两个概念(或者word sense)之间的语义相似度,它提供了六种计算相似度和三种计算概念之间的关联度方法,所有的这些方法都是基于WordNet词汇数据库。本文中,我们采用 WUP 相似度测量标注词之间的相关性。WUP方法[21]是由Wu与Palmer提出的基于路径结构的相似度度量方法,综合考虑了概念结点、共有父结点、根结点之间的路径关联情况。计算标节点 s1 和 s2 相似度的方法如下:
其中,将s3记为s1和s2最深上层父节点,N1表示s1到s3路径上节点的数量,N2表示s2到s3路径上节点的数量,N3表示s3到根节点路径上节点的数量。
****3.2提高标注准确率
将关键词种子集中的关键词编号,我们利用WUP相似度计算关键词之间的相关度。通过计算关键词之间的相关度得到一个对称相关度矩阵T:****
其中,n表示数据集中标注词的个数,wij 表示第i个标注词与第j个标注词之间的相关度。对于某一个关键词i,按照相关度从大到小得到一个向量
L,M 为标注词的序号。对于一幅图像,若其通过基于区域的标注方法得到y个标注关键词,计算标注词数据库中与该图