零基础入门--中文实体关系抽取（BiLSTM+attention，含代码）

最新推荐文章于 2024-04-19 21:22:19 发布

buppt

最新推荐文章于 2024-04-19 21:22:19 发布

阅读量4.6w

点赞数 34

分类专栏：知识图谱文章标签：关系抽取中文 BiLSTM+attention 知识图谱

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/buppt/article/details/82961979

版权

前面写过一片实体抽取的入门，实体关系抽取就是在实体抽取的基础上，找出两个实体之间的关系。

本文使用的是BiLSTM+attention模型，代码在这里，不定期对代码进行修改添加优化。

数据处理

其实数据处理的方法有很多，我用的是近两年英文论文使用的比较多的词向量+位置向量的方法。

中文实体关系抽取的数据实在是太难找了，我现在只有忘记在哪里找到的一个人物关系数据集。希望同学们能分享一些其他的数据集。

先看原始数据（其实原始数据里好多句子我都看不出来其中人物实体的关系）：

霍启山霍启刚兄弟姐妹两位弟弟：霍震霆与朱玲玲育有三子，大公子霍启山、二公子霍启刚、三公子霍启仁

先是两个实体，然后是两个实体之间的关系，最后是两个实体所在的句子，都用空格分开。

所以数据处理先将这4部分分开。

先将句子转换成词向量，或者叫字向量。具体方法是建立word2id词典，把每个字都转换成id。

然后记录句子中每个字距离两个实体的距离。比如前面的例子，霍启山是第一个实体，这里假设实体后面为正，汉字和标点符号都计算在内，句子开始“两”和实体一的距离是-20，“位”和实体一的距离是-19。。。最后一个字“仁”和实体一的距离为16。

每个字距离实体二的距离同上。

这样每个字都有了一个字向量和两个距离向量，将这三个向量结合起来，就可以作为模型的输入了

最低0.47元/天解锁文章

关注

34
点赞
踩
272

收藏

觉得还不错? 一键收藏
75
评论
零基础入门--中文实体关系抽取（BiLSTM+attention，含代码）

前面写过一片实体抽取的入门，实体关系抽取就是在实体抽取的基础上，找出两个实体之间的关系。本文使用的是BiLSTM+attention模型，代码在这里，不定期对代码进行修改添加优化。数据处理其实数据处理的方法有很多，我用的是近两年英文论文使用的比较多的词向量+位置向量的方法。中文实体关系抽取的数据实在是太难找了，我现在只有忘记在哪里找到的一个人物关系数据集。希望同学们能分享一些其他的数据集。...
复制链接

扫一扫

专栏目录

buppt CSDN认证博客专家 CSDN认证企业博客

码龄7年

122: 原创

4万+: 周排名

174万+: 总排名

45万+: 访问

: 等级

4074: 积分

204: 粉丝

213: 获赞

194: 评论

877: 收藏

私信

关注

热门文章

分类专栏

kubernetes源码学习 2篇
kubernetes 14篇
从零一起学react 8篇
从零写一个 Vue 6篇
从零一起学koa2 10篇
知识图谱 4篇
react 8篇
vue 15篇
微信小程序 4篇
koa2 10篇
java 2篇
javascript 6篇
leetcode 34篇
算法 4篇
bootstrap 2篇
HTTP 2篇
成都 1篇
test 4篇
CSS 3篇
hexo 2篇
Linux 9篇
echarts 1篇
git 1篇
vim 1篇
html 2篇
mongodb 2篇
移动端 1篇

最新评论

零基础入门--中文实体关系抽取（BiLSTM+attention，含代码）
YT提醒: 为什么运行完成后的文件打不开，pkl格式试了多种方法都打不开
Cilium架构简介&eBPF数据流向查看
宇智波阿威: 路由分析这部分前后逻辑太差。看的真费劲。另外pod ip地址一个10网段一个192网段。不知道你是咋整出来的。每段分析连个呈上启下的语言过度都有没有。单凭每段一句话前后都串联不起来。根本不知道你想说明什么。
CSDN博客积分规则
mikecor: 发15个字的评论能获得一次积分，不知道是不是真的，所以在这里试一下，看看能不能行，这积分真的是太难弄了
零基础入门--中文实体关系抽取（BiLSTM+attention，含代码）
ibudhydgy: 你好请问怎么输出各个关系的P R F呀
零基础入门--中文实体关系抽取（BiLSTM+attention，含代码）
豪凡: 将数据换了之后，为什么一直报错，我确定数据格式一样

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 75

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。