使用python将Excel数据转换为json数据
前段时间接触过将Excel数据装换为json数据的工作,今天做个记录,网上好像有工具可以直接转换,但是格式不能满足我的要求,后来自己就直接用python进行了数据转换。
话不多说,搞起
1. 原始数据格式
样式就是这个样式,一共2018,2019,2020三年的数据(数据是我随机生成的),前面两列数据合并在一起的,我是使用pandas读取Excel表的,需要将每个单元格填充,不然数据只会读到一个单元格中,咱们手动修改一下Excel表,如下图
2. 使用python进行数据格式转换
#先导入数据
import pandas as pd
import numpy as np
import json
data = pd.read_excel('./数据表.xlsx',sheet_name='整理后的数据')
### 特意调整好了格式 希望大家能看的懂
### 说明:以_dict结尾的变量名用来装这一层的数据,包括两部分,类型(如年份),数据(data),data等于_list数组;以_list结尾的变量名用来装下一级的所有数据,最后_list就是这一层的数据data
json_list = []
for year in data['年份'].unique(): #选一年
year_dict={} #建一个字典,用来存储 年和该年的数据
year_dict['year'] = year # 年
year_list = [] #建一个列表 用来存储 该年的数据; 现在数据暂时为空,需要在后面添加
year_data = data[data['年份']==year] #将数据降一级,只看该年的数据
for kind in year_data['分类'].unique(): #选一类
kind_dict={} #建一个字典,用来存储 类型和该类的数据
kind_dict['type'] = kind # 类型
kind_list = [] #建一个列表 用来存储 该类型的数据; 现在数据暂时为空,需要在后面添加
kind_data = year_data[year_data['分类']==kind] #将数据降一级,只看该类型的数据
for month in kind_data['月份'].unique(): #选一个月份
month_dict = {} #建一个字典,用来存储 月份和该类的数据
month_dict['month'] = month #月份
month_list = [] #建一个列表 用来存储 该类型的数据; 现在数据暂时为空,需要在后面添加
month_data = kind_data[kind_data['月份']==month]
for city in data.columns[3:]: #这里建议直接用原始数据data来分割,第4列以后的是数据
info={} #建一个字典,用来存储 城市和该市的数据
info['city'] = city #城市
info['data'] = month_data.iloc[0][city] #此时每个month_data只有一行数据了,就可以去除数值了
month_list.append(info) #将info加到month_list中
month_dict['data'] = month_list #month_list是month_dict的数据
kind_list.append(month_dict) #将month_dict加到kind_list中
kind_dict['data'] = kind_list #kind_list是kind_dict的数据
year_list.append(kind_dict) #将kind_dict加到year_list中
year_dict['data'] = year_list #year_list是year_dict的数据
json_list.append(year_dict) #将最终的数据都保存在json_list列表中
看看json_list样式,这是个列表,我们需要将数据转为字典,然后变为json
一般没有意外就可以这样保存为json文件了
json_dict = {}
json_dict['data'] = json_list
data_dict = json.dumps(json_dict, ensure_ascii=False)
with open('data.json','w') as f_w:
f_w.write(data_dict)
但是要是有意外呢?比如出现下面这个错误
这时就要加点东西了
class NpEncoder(json.JSONEncoder):
def default(self, obj):
if isinstance(obj, np.integer):
return int(obj)
elif isinstance(obj, np.floating):
return float(obj)
elif isinstance(obj, np.ndarray):
return obj.tolist()
else:
return super(NpEncoder, self).default(obj)
json_dict = {}
json_dict['data'] = json_list
data_dict = json.dumps(json_dict, ensure_ascii=False,cls=NpEncoder)
with open('data.json','w') as f_w:
f_w.write(data_dict)
3. 结果
来看看我们的json 文件,这是我想的样式,每个数据一一对应
总结:同一个数据可以调成不同的格式,这种一一对应数据看起来很直观,但是数据字段相对来说比较多,可以直接将数据存在一个列表中如:
['A市','B市','C市','D市','E市','F市','G市','H市','I市','J市','K市','L市','M市']
['2606','8457','8672','2756','7742','7225','6207','5041','6550','1254','2739','4556','4180']
可能过程有点绕,理清思路,就可以做出来了