WordNet 是一种英语词典,可以根据单词的语义信息构建语义网络。
其将词汇分为五大类:名词、动词、形容词、副词和虚词。语义关系包括上下位关系,同义关系,反义关系。
通过各种关系,可以丰富语料信息,可应用于词义消歧、相似度计算等问题。
- 导入nltk相关包,下载语料集。
- 获取单词的所有含义。
- 固定词性下的词集
- 相关词语含义下的定义,举例等。
- 固定词语含义下的同义词集
- 上位词
-
下位词
-
最低共同上位词集
-
词集的深度min_paths()及上位词路径
-
反义词
*两个词集的相似度:
相似度计算方法:
1.获取最低共同上位词集
2.获取词集的最小深度
计算: