主页:
RDF格式 word net:
http://www.w3.org/TR/wordnet-rdf/
在线查询:
http://wordnetweb.princeton.edu/perl/webwn
WordNet 主要有3个主概念 Synset, WordSense 和 Word。
一个Word可以有多个Synset,一个Synset有其解释它的意思的WordSense。
Synset是指一组同一概念的词的集合。
Synset, WordSense 又可以针对每个词的词性分为 名词性的 和 动词性的 等。
synset和其他synset之间的关系(注意是synset,所以如果一个word的两个synset之间也有可能有关系):
- hyponym:一个概念(Synset)又可以包括下义词(hyponym),既本体中的子类。webwn界面上选择direct hyponym只展示直接下义词,full hyponym 把下义词的下义词也展示出来。
- hypernym:上义词,父类。从inherited hypernym看出,wordnet一个synset的上义词只能有一个。也就是说从上下义词的关系上来说,wordnet是树状的,而不是网状的结构。
- part meronym:部分关系。列出这个概念的部分。
- part holonym:整体。列出这个概念作为部分所隶属的整体。
- derivationally related form :一般是指向这个synset的其他词性的synset。然后可以选W:word关系。
- sentence frame :
synset和其他word之间的关系:
- derivationally related form :指向其他词性的synset所属的词。需要有匹配的字母,比如某一synset内flower和bloom,同一意思,但他们的derivationally related form 一个是flowerly,一个是bloomly(假设有这样的副词)。
- Overview :
- synset :
Sense Number:是一个word的某一Synset的序号,名词动词分开计。
Frequency Count :一个word的某一Synset出现的次数,相当于概率了,数字越大概率越大。