超级超级详细的实体关系抽取数据预处理代码详解

最新推荐文章于 2024-04-16 10:05:23 发布

TNNAA

最新推荐文章于 2024-04-16 10:05:23 发布

阅读量3.4k

点赞数 7

分类专栏：关系抽取文章标签： python

本文链接：https://blog.csdn.net/TNNAA/article/details/107697201

版权

超级超级详细的实体关系抽取数据预处理代码详解

由于本人是代码小白,在学习代码过程中会出现很多的问题,所以需要一直记录自己出现的问题以及解决办法.
废话不多说,直接上代码!!!

一.data_process
1.由于数据集太大,然鹅本人的电脑…所以,我先添加了一段代码切分了一下数据集,因为数据集中都是三元组形式,所以可以直接笨拙的切分为几个文件
数据集切分
2.读取初始数据.读取切分之后的任意一个就OK了,存放为数组形式

3.保留元素全为中文的三元组

4.构建实体字典,为字典增加key-value对

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

TNNAA

关注关注

7
点赞
踩
37

收藏

觉得还不错? 一键收藏
2
评论
超级超级详细的实体关系抽取数据预处理代码详解

超级超级详细的实体关系抽取数据预处理代码详解由于本人是代码小白,在学习代码过程中会出现很多的问题,所以需要一直记录自己出现的问题以及解决办法.废话不多说,直接上代码!!!一.data_process1.由于数据集太大,然鹅本人的电脑…所以,我先添加了一段代码切分了一下数据集,因为数据集中都是三元组形式,所以可以直接笨拙的切分为几个文件2.读取初始数据.读取切分之后的任意一个就OK了,存放为数组形式3.保留元素全为中文的三元组4.构建实体字典,为字典增加key-value对输出结果应
复制链接

扫一扫