基本算法思路:WORDNET相似度计算算法
1、使用关系:
同义关系,is-a关系,part-of关系
2、概念之间以同义集关系进行跳转。
如果两概念之间为同义集关系,则直接计算,
否则同义集之间的关系跳转使用is-a关系和part-of关系
3、概念深度的计算考虑单关系(is-a关系)单向(从根结点到待测节点)开始扫描;
4、两个词语的相似度最终可以表示为:f(最短路径的路径权重,起止点深度对应的深度权重),具体的计算公式还需要再确认一下。
注意事项:
待测试的概念对可以指定所属同义集,也可不指定,此时用所有包含该概念的同义集集合作为待测概念;