python 将批量处理二进制json文件转为文本格式的json。

    二进制JSON(Binary JSON)是一种将JSON数据编码为二进制格式的方法。它旨在提供比纯文本JSON更高效的存储和传输方式。 在传统的JSON表示中,数据以纯文本形式进行序列化和反序列化。这种文本形式包括了可读性较高的字符,如双引号、逗号和换行符等。但是,这些字符会增加数据的大小,并且在网络传输时占用带宽。 而二进制JSON使用不同的编码方式,将JSON数据转换为二进制格式。这种格式通常更紧凑,不需要使用大量的字符来表示数据结构,因此可以减少存储空间和网络传输所需的带宽。 二进制JSON的编码和解码过程与文本JSON类似,只是数据被转换为二进制形式。编码过程将JSON对象和数组转换为二进制表示,而解码过程则将二进制数据还原为原始的JSON数据。 使用二进制JSON可以提高数据的处理速度和效率,特别是在大型数据集或高并发环境下。然而,由于它的二进制形式不易读取和编辑,对于调试和手动处理数据可能不太友好。

              这个需求来自我在一个json编辑网站上,制作json文件,最后发现它们都转化为了二进制json。最后发现在用python处理数据时存在诸多不便。所以,需要将它们转为文本格式的json。代码如下。    

import os
import json

def convert_binary_json_to_text(input_dir, output_dir):
    # 遍历目录下的所有文件
    for filename in os.listdir(input_dir):
        input_path = os.path.join(input_dir, filename)
        output_path = os.path.join(output_dir, filename)

        # 只处理以'.json'为扩展名的文件
        if filename.endswith('.json'):
            # 读取二进制JSON文件
            with open(input_path, 'rb') as binary_file: #文本json,只需加"r",二进制json需要"rb"模式。
                binary_data = binary_file.read()

            # 解码二进制JSON数据
            try:
                json_data = json.loads(binary_data.decode('utf-8-sig')) #去掉bom头。
            except json.JSONDecodeError as e:
                print(f"Error decoding JSON from file {input_path}: {e}")
                continue

            # 写入文本JSON文件
            with open(output_path, 'w',encoding="utf-8") as text_file:
                json.dump(json_data, text_file, indent=4,ensure_ascii=False)

            print(f"Converted {input_path} to text JSON")

# 输入和输出目录路径
input_directory = '输入目录'
output_directory = '输出目录'

# 调用函数进行转换
convert_binary_json_to_text(input_directory, output_directory)
  • 6
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值