一. WordNet
WordNet:是面向语义的英语词典,与传统词典相似,但结构更丰富。
1. 寻找同义词
以寻找'motorcar'的同义词集为例
同义词集:意义相同的词的集合。
词条:同义词集和词的配对。
例:找到指定同义词集的所有词条;查找特定的词条;得到一个词条所对应的同义词集;得到一个词条的名字。
2. WordNet的层次结构
WordNet概念的层次片段:每个节点对应一个同义词集;边表示上位词/下位词关系,即上级概念与从属概念的关系。
例:摩托车
(1).下位词
(2). 上位词
(3). 根上位同义词集
3.更多的词汇关系
(1). 整体与部分关系
例:树可分为树干、树冠等部分。一棵树的实质是由心材和边材组成的。树木的集合形成了森林。
(2). 蕴涵关系(动词之间)
例如:走路的动作包含着抬脚的动作。
(3). 反义词(词条之间)
(4). 语义相似度
path_similarity基于上位词层次结构概念中相互关联的最短路径下,在0~1范围内的相似度(两者之间没有路径就返回-1),同义词集与自身比较将返回1.