Python对象序列化性能比较：pickle、json、msgpack

最新推荐文章于 2024-06-20 17:54:56 发布

别里kov

最新推荐文章于 2024-06-20 17:54:56 发布

阅读量1.4k

点赞数

分类专栏：常用记录文章标签： python json 开发语言

本文链接：https://blog.csdn.net/qq_27144923/article/details/130151863

版权

常用记录专栏收录该内容

7 篇文章 1 订阅

订阅专栏

前言

最近在做毕设，需要读取处理大量的数据，txt中文文本，大概有83万个，多线程读取一次感觉非常慢，想到将读取后的列表序列化一下，保存在本地方便以后使用。之前一直用的pickle，由于处理的都是简单、小型的对象，对性能无感知，但这次处理的对象比较大，查了一下三种用的比较多方法：pickle、json、msgpack，正好对比一下。

三种工具介绍

Pickle

这是python标准库提供的序列化方法,可以序列化和反序列化任何python对象。它的优势在于速度快和支持任何python对象,缺点在于仅支持python解码器能解码的二进制数据,因此如果在不同的python版本或者平台之间互操作,可能会出现兼容性问题。

Json

JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式。它可以表达基本的数据类型,支持比较复杂的结构及数据集合。它只支持 python 基本数据类型、列表、元组、字典等,只要保证对象有 dict 和 json() 方法就可以序列化为 JSON 格式,易于跨语言传输数据。