小编典典
这里有四个转换步骤。
Python数据结构(嵌套字典,列表,字符串,数字,布尔值)
包含该数据结构(“ JSON”)的序列化表示形式的Python字符串
包含该字符串表示形式的字节列表(“ UTF-8”)
包含先前字节列表(“ gzip”)表示形式的字节列表
因此,让我们一步一步地采取这些步骤。
import gzip
import json
data = []
for i in range(N):
uid = "whatever%i" % i
dv = [1, 2, 3]
data.append({
'what': uid,
'where': dv
}) # 1. data
json_str = json.dumps(data) + "\n" # 2. string (i.e. JSON)
json_bytes = json_str.encode('utf-8') # 3. bytes (i.e. UTF-8)
with gzip.GzipFile(jsonfilename, 'w') as fout: # 4. gzip
fout.write(json_bytes)
注意,"\n"这里添加完全是多余的。它不会破坏任何东西,但是除此之外,它没有任何用处。我添加它只是因为您的代码示例中包含了它。
阅读则完全相反:
with gzip.GzipFile(jsonfilename, 'r') as fin: # 4. gzip
json_bytes = fin.read() # 3. bytes (i.e. UTF-8)
json_str = json_bytes.decode('utf-8') # 2. string (i.e. JSON)
data = json.loads(json_str) # 1. data
print(data)
当然,这些步骤可以合并:
with gzip.GzipFile(jsonfilename, 'w') as fout:
fout.write(json.dumps(data).encode('utf-8'))
和
with gzip.GzipFile(jsonfilename, 'r') as fin:
data = json.loads(fin.read().decode('utf-8'))
2020-07-27