Sematch,知识图的语义相似性框架

最新推荐文章于 2024-04-19 10:10:52 发布

TNNAA

最新推荐文章于 2024-04-19 10:10:52 发布

阅读量682

点赞数 1

分类专栏：语义相似性文章标签： python

语义相似性专栏收录该内容

1 篇文章 0 订阅

订阅专栏

Sematch,知识图的语义相似性框架

Sematch是一个用于知识图语义相似度(KGs)开发、评价和应用的集成框架。利用Sematch很容易计算概念、单词和实体的语义相似度得分。Sematch专注于特定的基于知识的语义相似度度量，这些度量依赖于分类中的结构化知识(例如深度、路径长度等)和统计信息内容。基于知识的方法不同于基于语料库的方法，它们依赖于共现(例如点态互信息)或分布相似性(潜在语义分析、Word2Vec、GLOVE等)。基于知识的方法通常用于结构化知识库检索，而基于语料库的方法通常用于文本语料库。
在文本分析应用中，从概念层到词和句子层的语义相似度的使用采用了一个通用的管道。例如，首先根据WordNet概念的相似度评分来计算单词的相似度，然后通过组合单词相似度评分来计算句子的相似度。最后，通过识别重要句子，如TextRank，可以计算出文档的相似度。
在KGs中，概念通常表示本体类，实体表示本体实例。此外，这些概念通常被构造成层次分类法，如DBpedia本体类，因此KG中概念相似性的量化依赖于相似语义信息(如路径长度、深度、最小公共subsumer、信息内容)和语义相似性度量(如path、Wu & Palmer、Li、Resnik、Lin、Jiang & Conrad、WPath)。因此，Sematch提供了一个集成的框架来开发和评估概念、单词、实体及其应用的语义相似度指标。
首先需要安装科学计算库numpy和scipy。下面显示了一个使用pip安装它们的示例。
在这里插入图片描述
根据不同的操作系统，您可以使用不同的方式来安装它们。在成功安装numpy和scipy之后，可以使用以下命令安装sematch。
或者，您可以使用开发版本使用setuptools克隆和安装Sematch。我们建议您更新pip和setuptools。
在这里插入图片描述
Sematch的核心模块是度量以概念分类表示的概念之间的语义相似度。单词相似度是根据WordNet概念的最大语义相似度计算的。您可以使用Sematch来计算基于WordNet具有各种语义相似度度量的多语言单词相似度。

TNNAA

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Sematch,知识图的语义相似性框架

Sematch,知识图的语义相似性框架Sematch是一个用于知识图语义相似度(KGs)开发、评价和应用的集成框架。利用Sematch很容易计算概念、单词和实体的语义相似度得分。Sematch专注于特定的基于知识的语义相似度度量，这些度量依赖于分类中的结构化知识(例如深度、路径长度等)和统计信息内容。基于知识的方法不同于基于语料库的方法，它们依赖于共现(例如点态互信息)或分布相似性(潜在语义分析、Word2Vec、GLOVE等)。基于知识的方法通常用于结构化知识库检索，而基于语料库的方法通常用于文本语料库
复制链接

扫一扫