项目实训第五周第一次记录

最新推荐文章于 2022-05-05 18:10:47 发布

大坡山小霸王

最新推荐文章于 2022-05-05 18:10:47 发布

阅读量239

点赞数

分类专栏：项目实训

本文链接：https://blog.csdn.net/weixin_44742887/article/details/119155002

版权

项目实训专栏收录该内容

15 篇文章 0 订阅

订阅专栏

文章目录

7.26

关系获取

关系获取技术涉及到的功能如下：

①实体查询：搜索某一实体，得到与之相关的实体及它们之间的关系

②关系查询：查询三元组关系entity1-[relation]->entity2 , 分为如下几种情况:

* 指定第一个实体entity1

* 指定第二个实体entity2

* 指定第一个实体entity1和关系relation

* 指定关系relation和第二个实体entity2

* 指定第一个实体entity1和第二个实体entity2

* 指定第一个实体entity1和第二个实体entity2以及关系relation

③农知问答：输入问题，根据图谱关系得到答案。涉及更多关系，例如城市、气候、植物之间的关系。

接下来分析寻求解决方法。

众所周知，文本语句的结构复杂，人工制定规则几乎不可能实现。因此我们自然而然地想到可以通过训练关系预测模型获得足够多的三元关系数据实现上述功能。

但是进一步思考我们这里定义的需求，即需要实现的功能都是只需要给用户呈现出来实体与实体的关系，而不需要根据实际的文本提取文本中实体的关系。所以我们如果能够通过除关系预测模型的其他方式获得足够多的农业实体关系数据，则不需要训练模型，从而解决了使用有监督学习的方法进行关系提取中人工标注训练样本成本巨大，获得足够多的高质量训练样本的难题。

甚至可以说，根据当前的需求，训练关系预测模型需要达到足够多的训练样本，甚至比直接获取三元关系更为复杂。因为训练样本是需要将三元关系对应到丰富的非结构化语料中。

通过查阅资料得知Wikidata是一个开放的全领域的知识库，其中包含大量的实体以及实体间的关系可以爬取。wikidata实体页面包含实体的描述和与该实体相关联的其它实体及对应的关系。现存许多获取知识图谱中三元组关系的python脚本和已爬取好的数据集，所以只需要爬取或者查找合适的足够丰富的农业三元关系数据集存储到图数据库中，该问题就迎刃而解了。