背景
- 通常情况下我们都会使用
json
标准库中的json.load
来加载json
文件 - 但是这种方式的缺点就是,他会一次性将
json
文件加载到内存中,所以电脑会很卡,等待时间很长 - 因此推荐使用
ijson
的方式来替代
安装
pip install ijson
使用
- 通过这种方式加载,
record
就是每一个json
文件中的item
了
with open(path, 'r') as f:
i = 0
for record in tqdm(ijson.items(f, "item")):
origin = record["original_text"]
correct = record["correct_text"]