前言
excel表格中的数据,转化为json格式,再用程序去处理json数据,是常见的数据处理方式。这样可以实现按照需求去做数据处理。
需要用到的软件
除了python环境外,主要用到读取excel文件的库,以及json数据格式处理库。
常用的excel库:
openpyxl: 可以用来读写Excel文件的库。可以处理.xlsx文件,支持读取和写入单元格、行、列等操作。
xlrd:可以用来读取Excel文件的库。可以处理.xls文件,包括读取单元格、行、列等操作。
json库:
json:Python自带的JSON解析库,支持将JSON字符串解析成Python对象,也支持将Python对象转换为JSON字符串。
requests:第三方库requests可以快速发送HTTP请求,并自动解析JSON数据。
软件的安装:
例如,openpyxl的安装方式如下:
pip install openpyxl
excel常用组件概念:
workbook对象:对应于一个excel文件
Sheet对象:对应于一个sheet
单元格对象:sheet中的一个单元格
行:sheet中的行
列:sheet中的列
openpyxl和xlrd都支持以上概念,都有对应的获取方法。
实践
例子1: 用openpyxl来进行excel的处理,json库来进行json数据的处理。
# -*- coding: utf-8 -*-
import os
import sys
import openpyxl
import json
import io
# 将json保存为文件
def save2json(jd, json_file_name):
file = io.open(json_file_name, 'w', encoding='utf-8')
# 把对象转化为json对象
# indent: 参数根据数据格式缩进显示,读起来更加清晰
# ensure_ascii = True:默认输出ASCII码,如果把这个该成False, 就可以输出中文。
txt = json