Sematch,知识图的语义相似性框架

Sematch,知识图的语义相似性框架

Sematch是一个用于知识图语义相似度(KGs)开发、评价和应用的集成框架。利用Sematch很容易计算概念、单词和实体的语义相似度得分。Sematch专注于特定的基于知识的语义相似度度量,这些度量依赖于分类中的结构化知识(例如深度、路径长度等)和统计信息内容。基于知识的方法不同于基于语料库的方法,它们依赖于共现(例如点态互信息)或分布相似性(潜在语义分析、Word2Vec、GLOVE等)。基于知识的方法通常用于结构化知识库检索,而基于语料库的方法通常用于文本语料库。
在文本分析应用中,从概念层到词和句子层的语义相似度的使用采用了一个通用的管道。例如,首先根据WordNet概念的相似度评分来计算单词的相似度,然后通过组合单词相似度评分来计算句子的相似度。最后,通过识别重要句子,如TextRank,可以计算出文档的相似度。
在KGs中,概念通常表示本体类,实体表示本体实例。此外,这些概念通常被构造成层次分类法,如DBpedia本体类,因此KG中概念相似性的量化依赖于相似语义信息(如路径长度、深度、最小公共subsumer、信息内容)和语义相似性度量(如path、Wu & Palmer、Li、Resnik、Lin、Jiang & Conrad、WPath)。因此,Sematch提供了一个集成的框架来开发和评估概念、单词、实体及其应用的语义相似度指标。
首先需要安装科学计算库numpy和scipy。下面显示了一个使用pip安装它们的示例。
在这里插入图片描述
根据不同的操作系统,您可以使用不同的方式来安装它们。在成功安装numpy和scipy之后,可以使用以下命令安装sematch。
或者,您可以使用开发版本使用setuptools克隆和安装Sematch。我们建议您更新pip和setuptools。
在这里插入图片描述
Sematch的核心模块是度量以概念分类表示的概念之间的语义相似度。单词相似度是根据WordNet概念的最大语义相似度计算的。您可以使用Sematch来计算基于WordNet具有各种语义相似度度量的多语言单词相似度。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值