kettle 解析 单条 json文件_Python更快的解析大JSON文件

本文探讨了在处理大型JSON文件时,如何通过使用pypy和UltraJson来提高解析效率。测试结果显示,pypy搭配json库在解码和编码上表现最优,而UltraJson在特定场景下也有显著提升。文章提供了详细的测试数据,并提醒读者需根据实际情况选择合适的库。
摘要由CSDN通过智能技术生成

提出问题

今天用python的simplejson库解析一个 >200MB 的JSON文件,发现一次decode/encode都得要 >10s,这个在我开来,实在太慢了,有没有更快的库了?

先给出我的简单测试结果

  • json大小:245MB
  • 测试方法:read文件内容,然后一次decode, 一次encode

| | simplejson | json | ujson | | ------ | ---------- | ---- | ------| | pypy | 40s多 | 10s | 无 | | cpython | 12s多 |17s多 | 10s多 |

  • 不成熟的结论: pypy+json最快

方法一:pypy+json

python自带的JSON库是用纯python代码实现的,而pypy对纯python代码的加速效果比较好。至于为什么,大家可以去google吧,很多文章解释的很好。

方法二:UltraJson

  • 我首先想到的用C库来做JSON的解析,原因你懂的,而C语言有个JSON库叫CJSON,于是用python+cjson在google里找到了UltraJson
  • UltraJson是作者用C语言实现的JSON库,实际测试的效果是,整个encode的效率提升了2倍多。

使用方法:

  • 安装:pip instal ujson>>> import ujson >>> ujson.dumps([{"key": "value"}, 81,
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值