将json中指定的两种属性的数据转换成TXT文本

最新推荐文章于 2023-12-21 16:16:29 发布

关切得大神

最新推荐文章于 2023-12-21 16:16:29 发布

阅读量912

点赞数

分类专栏：学习

原文链接：https://blog.csdn.net/qq_32293249/article/details/89025282

版权

学习专栏收录该内容

264 篇文章 17 订阅

订阅专栏

在做信息抽取的时候，需要对训练数据的object和 subject数据计算他们和句中每一个实体的距离，所以需要用到分词，但大部分的分词工具都不能准确将object和subject分出来，需要先在json类型的数据中先提取这两种数据：

import json
fr=open("/../baidudata/train_data.json","r")
data=[]
for line in fr.readlines():
    ls=json.loads(line) 
    data.append(ls["spo_list"][0]["object"])
    data.append(ls["spo_list"][0]["subject"])
fw=open("../baidudata/train.txt","w")  
for line in data:
    fw.write(line+"\n") 
fw.close()

原始json数据：
在这里插入图片描述
第一行的具体信息：

生成的数据：
在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

关切得大神

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
将json中指定的两种属性的数据转换成TXT文本

在做信息抽取的时候，需要对训练数据的object和 subject数据计算他们和句中每一个实体的距离，所以需要用到分词，但大部分的分词工具都不能准确将object和subject分出来，需要先在json类型的数据中先提取这两种数据：import jsonfr=open("/../baidudata/train_data.json","r")data=[]for line in fr.readlines(): ls=json.loads(line) data.append(ls["s
复制链接

扫一扫