python json文件比较快_在Python中读取数千个JSON文件的最快方法

最新推荐文章于 2024-08-06 14:09:45 发布

weixin_39523887

最新推荐文章于 2024-08-06 14:09:45 发布

阅读量529

点赞数

文章标签： Python JSON 文件读取性能优化大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39523887/article/details/111964161

版权

我需要分析一些JSON文件。我使用iPython(Python 3.5.2 | IPython 5.0.0)，将文件读入字典并将每个字典附加到列表中。在

我的主要瓶颈是读取文件。有些文件比较小，读起来很快，但是较大的文件会减慢我的速度。在

以下是一些示例代码(抱歉，我无法提供实际的数据文件)：import json

import glob

def read_json_files(path_to_file):

with open(path_to_file) as p:

data = json.load(p)

p.close()

return data

def giant_list(json_files):

data_list = []

for f in json_files:

data_list.append(read_json_files(f))

return data_list

support_files = glob.glob('/Users/path/to/support_tickets_*.json')

small_file_test = giant_list(support_files)

event_files = glob.glob('/Users/path/to/google_analytics_data_*.json')

large_file_test = giant_list(event_files)

支持票的大小非常小——我见过的最大的是6KB。所以，这段代码运行得相当快：

^{pr2}$

但是更大的文件肯定会减慢我的速度…这些事件文件每个可以达到~2.5MB：In [7]: len(event_files) # there will be a lot more of these soon :-/

Out[7]: 397

In [8]: %timeit giant_list(event_files)

1 loop, best of 3: 14.2 s per loop

我研究过如何加快这个过程，并遇到了this post，然而，当使用UltraJSON时，时间稍微差一点：In [3]: %timeit giant_list(traffic_files)

1 loop, best of 3: 16.3 s per loop

SimpleJSON没有做得更好：In [4]: %timeit giant_list(traffic_files)

1 loop, best of 3: 16.3 s per loop

任何关于如何优化这段代码并更有效地将大量JSON文件读入Python的提示，我们将不胜感激。在

最后，this post是我发现的最接近我问题的地方，但是它处理的是一个巨大的JSON文件，而不是很多更小的文件。在

weixin_39523887

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python json文件比较快_在Python中读取数千个JSON文件的最快方法

我需要分析一些JSON文件。我使用iPython(Python 3.5.2 | IPython 5.0.0)，将文件读入字典并将每个字典附加到列表中。在我的主要瓶颈是读取文件。有些文件比较小，读起来很快，但是较大的文件会减慢我的速度。在以下是一些示例代码(抱歉，我无法提供实际的数据文件)：import jsonimport globdef read_json_files(path_to_file)...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。