收到格式类似下图的一份数据,需求是将 json 转化为 dataframe,
因为文件包含多个 json 文件,想到的解决思路是循环读取每一行成为 json,再将它转换成 dataframe,建立一个空的 dataframe,再将数据一行一行的填进去,另外可以看一下整个过程所需的时间,以下是代码:
import pandas as pd
import json
import time
path=r'...\test_01.txt'
start_time = time.time()
file=open(path,'rb')
js = file.read().decode('utf-8')
data = pd.DataFrame()
for line in open(path,encoding='UTF-8'):
data_list = json.loads(line)
data_df = pd.DataFrame(data_list, index=[0])
data = data.append(data_df)
end_time = time.time()
print('耗时 : %s秒'%round(end_time-start_time,2))