WordNet介绍及相似度计算

WordNet 是一种英语词典,可以根据单词的语义信息构建语义网络。
其将词汇分为五大类:名词、动词、形容词、副词和虚词。语义关系包括上下位关系,同义关系,反义关系。
通过各种关系,可以丰富语料信息,可应用于词义消歧、相似度计算等问题。
  • 导入nltk相关包,下载语料集。
    在这里插入图片描述
  • 获取单词的所有含义。
    在这里插入图片描述
  • 固定词性下的词集
    在这里插入图片描述
  • 相关词语含义下的定义,举例等。
    在这里插入图片描述
  • 固定词语含义下的同义词集
    在这里插入图片描述
  • 上位词

在这里插入图片描述

  • 下位词
    在这里插入图片描述

  • 最低共同上位词集
    在这里插入图片描述

  • 词集的深度min_paths()及上位词路径
    在这里插入图片描述
    在这里插入图片描述

  • 反义词
    在这里插入图片描述
    *两个词集的相似度:
    在这里插入图片描述
    相似度计算方法:
    1.获取最低共同上位词集
    在这里插入图片描述
    2.获取词集的最小深度
    在这里插入图片描述
    计算:
    在这里插入图片描述

  • 2
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值