二进制JSON(Binary JSON)是一种将JSON数据编码为二进制格式的方法。它旨在提供比纯文本JSON更高效的存储和传输方式。 在传统的JSON表示中,数据以纯文本形式进行序列化和反序列化。这种文本形式包括了可读性较高的字符,如双引号、逗号和换行符等。但是,这些字符会增加数据的大小,并且在网络传输时占用带宽。 而二进制JSON使用不同的编码方式,将JSON数据转换为二进制格式。这种格式通常更紧凑,不需要使用大量的字符来表示数据结构,因此可以减少存储空间和网络传输所需的带宽。 二进制JSON的编码和解码过程与文本JSON类似,只是数据被转换为二进制形式。编码过程将JSON对象和数组转换为二进制表示,而解码过程则将二进制数据还原为原始的JSON数据。 使用二进制JSON可以提高数据的处理速度和效率,特别是在大型数据集或高并发环境下。然而,由于它的二进制形式不易读取和编辑,对于调试和手动处理数据可能不太友好。
这个需求来自我在一个json编辑网站上,制作json文件,最后发现它们都转化为了二进制json。最后发现在用python处理数据时存在诸多不便。所以,需要将它们转为文本格式的json。代码如下。
import os import json def convert_binary_json_to_text(input_dir, output_dir): # 遍历目录下的所有文件 for filename in os.listdir(input_dir): input_path = os.path.join(input_dir, filename) output_path = os.path.join(output_dir, filename) # 只处理以'.json'为扩展名的文件 if filename.endswith('.json'): # 读取二进制JSON文件 with open(input_path, 'rb') as binary_file: #文本json,只需加"r",二进制json需要"rb"模式。 binary_data = binary_file.read() # 解码二进制JSON数据 try: json_data = json.loads(binary_data.decode('utf-8-sig')) #去掉bom头。 except json.JSONDecodeError as e: print(f"Error decoding JSON from file {input_path}: {e}") continue # 写入文本JSON文件 with open(output_path, 'w',encoding="utf-8") as text_file: json.dump(json_data, text_file, indent=4,ensure_ascii=False) print(f"Converted {input_path} to text JSON") # 输入和输出目录路径 input_directory = '输入目录' output_directory = '输出目录' # 调用函数进行转换 convert_binary_json_to_text(input_directory, output_directory)