在ubuntu中读取与保存json文件

本文介绍了如何使用Python和jq工具将txt文件内容转换为JSON格式,包括读取dev.json的示例,创建json_data列表,处理txt文件内容,并通过json.dump将数据写入train.json。涉及到了json文件操作和文本处理的基础技巧。
摘要由CSDN通过智能技术生成

最近在做数据预处理,仓库里的数据都是json格式,我需要把自己的txt数据转成json格式,这样就能用别人的代码了~~

首先,浏览/读取json数据。

使用了一个轻量级的json解析工具:jq,安装、使用都很简单,可直接在Terminal中安装使用。
具体可参考给力的linux命令–jq简易教程
使用示例:

username@magicbox:~/Downloads/githubPro_HUB/11-ChineseNMT-master/data/json$ cat dev.json | jq '.[:1]'
[
  [
    "Some analysts argue that the negative effects of such an outcome would only last for “months.”",
    "某些分析家认为军事行动的负面效果只会持续短短“几个月”。"
  ]
]
username@magicbox:~/Downloads/githubPro_HUB/11-ChineseNMT-master/data/json$ cat dev.json | jq '.[0]'
[
  "Some analysts argue that the negative effects of such an outcome would only last for “months.”",
  "某些分析家认为军事行动的负面效果只会持续短短“几个月”。"
]

可以看到,dev.json存储的是列表数据,每个元素都是一个列表(有两个元素)。

其次,读取待存入的数据jsonData

这里需要存入的是文件夹下的所有txt文件的内容,因此先建立空的列表json_data = []
在读取txt文件内容,使用append方法:json_data.append([text1, text2])

示例:

import os
for root, dirs, files in os.walk('./source'):
    for file in files:
        # 获取文件所属目录
        # print(root)
        # 获取文件路径
        # print(os.path.join(root, file))
        text_a = open('./source/'+file, 'r')
        text_b = open('./target/'+file.replace('A','B'), 'r')
        textA = text_a.read()
        textB = text_b.read()
        jsonData.append([textA, textB]) # "\n" still in every sentence

mk:中途读取txt报错了,就把'r'改称‘rb’,这样一来json文件内容简直不能看,而且不能转回中文;定位错误后删除出错的 txt文件

将2中的数据存入json文件

没有train.json会自动创建

import json
with open("./json/train.json","w") as f:
    json.dump(jsonData,f)
    print("已生成train.json文件...")

json文件数据太多就不展示了。

总结

综上,创建json并写入数据到json的步骤大概是:

  1. 预览想要得到的json数据的格式
  2. 按照上述格式创建字典/列表,使用append方法将自己的数据写入列表
  3. 使用dump方法将列表写入文件

如果要在已有的json文件上追加数据,在第一步,就要使用load方法读入json数据,再进行2、3。

还有几个有意思的知识点日後再看,先标记:
脚本之家:python读写json文件的简单实现(被华为云作为精品文章转载)

华为云精排版:python:json文件的保存与读取

日后再学:json.dumps与json.dump的区别 json.loads与json.load的区别
python: 列表 + 字典 + 向json文件追加数据

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值