python知识图谱关系抽取算法_spo_extract_platform

最新推荐文章于 2023-03-11 14:18:03 发布

weixin_39539002

最新推荐文章于 2023-03-11 14:18:03 发布

阅读量1.3k

点赞数

文章标签： python知识图谱关系抽取算法

本文介绍了使用Python进行开放领域关系抽取的项目，涉及序列标注和文本二分类算法，如ALBERT+BiLSTM+CRF和ALBERT+BiGRU+ATT。已有的标注数据主要包括新闻、小说内容，涵盖人物头衔、关系等信息。项目提供已训练好的模型，并分享了提升抽取效果的方法，如增加数据量和改进模型结构。

摘要由CSDN通过智能技术生成

开放领域的关系抽取的一次尝试

平台组成

标注平台（前端网页），对应目录spo_tagging_platform；

标注内容： S,P,O, is_tagging, 原文以及SPO的关系。

模型：

S,P,O: 序列标注算法（ALBERT+BiLSTM+CRF），对应目录sequence_labeling，在测试集上的F1大约为81%；

关系抽取: 文本二分类(ALBERT+BiGRU+ATT)，对应目录text_classification，在测试集上的准确率大约为96%。

标注语料来源于新闻内容和小说内容。

该项目在提取小说、新闻以及其他无结构文本方面的应用，对应目录为extract_example。

数据介绍

现阶段的序列标注算法的样本为3211个，关系抽取的标注数据为9279，共有关系1365个，数量最多的前20个关系如下图：

平台使用前的准备工作

该平台采用Python3开发，需要安装的模块参考requirements.txt

如何使用该平台？

序列标注算法和文本二分类已经训练好，可以直接clone下来使用。

运行sequence_labeling/run.py，该HTTP服务运行端口为12306；

运行t

最低0.47元/天解锁文章

weixin_39539002

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。