python excel文件数据转成json

开发环境:
mac10.12+python3.6
我这里示例代码是excel形式的省区市转成json的,excel文件以及代码打包请移步
简单粗暴,直接上代码~


# coding=utf-8

# # 文件位置
# fileLocation = "/Users/luoxiaohui/Desktop/2016.xls"
#
# import xlrd
# import xlwt
#
# bk = xlrd.open_workbook(fileLocation)
# sh = bk.sheet_by_name("2016年行政区划")
# nrows = sh.nrows
# ncols = sh.ncols
# # print(nrows)
# # print(ncols)
#
# filename = xlwt.Workbook()
# sheet = filename.add_sheet("精简版")
#
# for row in range(3, nrows):
#     # print("第" + str(row) + "行的数据:" + sh.cell(row, 1).value)
#     if str(sh.cell(row, 3).value) == '5.0':
#         print("你被剔除了。。。")
#     else :
#         print("准备写入数据到新表格中。。。")
#         for col in range(4):
#             sheet.write(row, col, sh.cell(row, col).value)
#
# filename.save("/Users/luoxiaohui/Desktop/new.xls")



# ====================================================狠严肃的分割线============================================================


# 文件位置
fileLocation = "/Users/luoxiaohui/Desktop/new.xls"

import xlrd

bk = xlrd.open_workbook(fileLocation)
sh = bk.sheet_by_name("精简版")
allRows = sh.nrows
allCols = sh.ncols

# 所有省级的行数数组
proviceRows = []
# # 所有市级的行数数组
# cityRows = []
# # 所有区级的行数数组
# areaRows = []

# 构造字典 装载所有数据
allJsonData = []
# 构造字典 装载省级数据
allProvinceData = {}
# 构造字典 装载市级数据
allCityData = {}
# 构造字典 装载县级数据
allAreaData = {}

nrows = 3630

# 获取所有省级,市级,区级的行数数组
for row in range(0, nrows):
    # print("第" + str(row) + "行的数据:" + sh.cell(row, 1).value)
    areaCode = str(sh.cell(row, 0).value).replace(".0","")
    areaType = str(sh.cell(row, 3).value).replace(".0","")
    # 首先,获取所有areaType为2的行数
    if areaType == "2":
        proviceRows.append(row)

for proviceIndex in range(0, len(proviceRows)):
    print("============================以下是" + str(
        sh.cell(proviceRows[proviceIndex], 1).value) + "的数据=========================")

    itemData = {}

    provinceCode = str(sh.cell(proviceRows[proviceIndex], 0).value).replace(".0","")
    provinceName = str(sh.cell(proviceRows[proviceIndex], 1).value)
    provinceType = str(sh.cell(proviceRows[proviceIndex], 3).value).replace(".0","")
    province = {}
    itemData["provinceCode"] = provinceCode
    itemData["provinceName"] = provinceName
    itemData["provinceType"] = provinceType

    # itemData["province"] = province

    # 获取每个省里面省,市,区三个级别所有的总数
    if proviceIndex + 1 != len(proviceRows):

        count = proviceRows[proviceIndex + 1] - proviceRows[proviceIndex]
        print("count-->" + str(count))
    else:

        count = nrows - proviceRows[proviceIndex]

    # 保存每个省份中所有市级所在的行数索引
    cityRows = []
    # 获取每个省级中所有areaType是3,也即市级的索引,城市名,areaType数据
    for row in range(proviceRows[proviceIndex], proviceRows[proviceIndex] + count):
        areaType = str(sh.cell(row, 3).value).replace(".0","")
        areaCode = str(sh.cell(row, 0).value).replace(".0","")
        cityName = str(sh.cell(row, 1).value)

        print("areaType-->" + areaType + ";row-->" + str(row))

        if areaType == "3":
            cityRows.append(row)

    cities = []
    for cityIndex in range(len(cityRows)):
        print(sh.cell(cityRows[cityIndex], 1).value + "下的县区级数据有:")
        cityType = str(sh.cell(cityRows[cityIndex], 3).value).replace(".0","")
        cityCode = str(sh.cell(cityRows[cityIndex], 0).value).replace(".0","")
        cityName = str(sh.cell(cityRows[cityIndex], 1).value)

        city = {}
        city["cityType"] = cityType
        city["cityCode"] = cityCode
        city["cityName"] = cityName

        if (cityIndex + 1) != len(cityRows):

            areaCount = cityRows[cityIndex + 1] - cityRows[cityIndex] - 1
        else:
            # 如果是最后一个的话:
            if len(cityRows) == 1:
                # 如果只有一个市级城市,用城市总数减去一个省行数,减去一个市行数
                areaCount = count - 2
            else:
                # 最后一个市级中的区级城市总数=下一个省级城市的索引减去本省中最后一个市级城市的索引
                if proviceIndex != len(proviceRows) - 1:
                    areaCount = proviceRows[proviceIndex + 1] - cityRows[len(cityRows) - 1] - 1

        areas = []
        # 保存每个市级中所有区县级所在的行数索引
        areaRows = []
        # 获取每个市级中所有areaType是4,也即区县级的索引,城市名,areaType的数据
        for row in range(cityRows[cityIndex], cityRows[cityIndex] + areaCount + 1):

            if row < nrows:
                areaType = str(sh.cell(row, 3).value).replace(".0","")
                areaCode = str(sh.cell(row, 0).value).replace(".0","")
                areaName = str(sh.cell(row, 1).value)

                if areaType == "4":
                    print(areaName)
                    area = {}
                    area["areaType"] = areaType
                    area["areaCode"] = areaCode
                    area["areaName"] = areaName
                    areas.append(area)
        city["areas"] = areas
        cities.append(city)
    itemData["cities"] = cities
    allJsonData.append(itemData)


# 对香港和澳门特殊处理,因为他俩只有3,4两级,木有2级
proviceRows = []
# 获取所有省级,市级,区级的行数数组
for row in range(nrows, allRows):
    areaCode = str(sh.cell(row, 0).value).replace(".0","")
    areaType = str(sh.cell(row, 3).value).replace(".0","")
    # 首先,获取所有areaType为3的行数
    if areaType == "3":
        print("row-->" + str(row))
        proviceRows.append(row)

for proviceIndex in range(0, len(proviceRows)):

    itemData = {}

    provinceCode = str(sh.cell(proviceRows[proviceIndex], 0).value).replace(".0","")
    provinceName = str(sh.cell(proviceRows[proviceIndex], 1).value)
    provinceType = str(sh.cell(proviceRows[proviceIndex], 3).value).replace(".0","")
    print("============================以下是" + str(
                sh.cell(proviceRows[proviceIndex], 1).value) + "的数据=========================")
    province = {}
    itemData["provinceCode"] = provinceCode
    itemData["provinceName"] = provinceName
    itemData["provinceType"] = provinceType

    # itemData["province"] = province

    # 获取每个省里面省,市两个级别所有的总数
    if proviceIndex + 1 != len(proviceRows):

        count = proviceRows[proviceIndex + 1] - proviceRows[proviceIndex]
    else:

        count = allRows - proviceRows[proviceIndex]

    # 保存每个省份中所有市级所在的行数索引
    cities = []
    city = {}
    city["cityType"] = provinceType
    city["cityCode"] = provinceCode
    city["cityName"] = provinceName

    areas = []
    # 获取每个省级中所有areaType是3,也即市级的索引,城市名,areaType数据
    for row in range(proviceRows[proviceIndex], proviceRows[proviceIndex] + count):
        area = {}
        areaType = str(sh.cell(row, 3).value).replace(".0","")
        areaCode = str(sh.cell(row, 0).value).replace(".0","")
        areaName = str(sh.cell(row, 1).value)

        if areaType == "4":
            print(areaName)
            area["areaType"] = areaType
            area["areaCode"] = areaCode
            area["areaName"] = areaName
            areas.append(area)
    # city其实只有一个,所以放在这里
    city["areas"] = areas
    cities.append(city)
    itemData["cities"] = cities
    allJsonData.append(itemData)

import json

data = json.dumps(allJsonData, ensure_ascii=False, default="utf-8")


def save(filename, contents):
    fh = open(filename, 'w')
    fh.write(contents)
    fh.close()


save('/Users/luoxiaohui/Desktop/new.txt', data)
### 回答1: 可以使用Python中的pandas库来读取Excel文件,然后将数据转换为字典格式,最后使用json库将字典转换为json格式。示例代码如下: ```python import pandas as pd import json # 读取Excel文件 df = pd.read_excel('data.xlsx') # 将数据转换为字典格式 data = df.to_dict(orient='records') # 将字典转换为json格式 json_data = json.dumps(data, ensure_ascii=False) print(json_data) ``` 其中,'data.xlsx'是Excel文件的路径,'ensure_ascii=False'参数可以保证中文字符不被转义为Unicode编码。 ### 回答2: 使用PythonExcel数据转换为JSON格式的方法如下: 首先,需要安装openpyxl库。通过pip install openpyxl命令进行安装。 然后,导入openpyxl库,并读取Excel文件。使用load_workbook()函数加载Excel文件,然后选择要读取的工作表。 接下来,获取Excel文件中的数据。使用iter_rows()函数遍历每一行数据,并将数据存储在一个列表中。 创建一个空的字典对象,并将Excel数据逐行添加到字典中。 最后,使用json库的dumps()函数将字典对象转换为JSON格式,并将其保存到一个新的文件中。将文件名和保存路径作为参数传递给open()函数,并指定写入模式。 以下是一个示例代码: ```python import openpyxl import json # 读取Excel文件 workbook = openpyxl.load_workbook('data.xlsx') sheet = workbook.active data = [] # 获取Excel文件中的数据 for row in sheet.iter_rows(values_only=True): # 将每行数据存储在字典对象中 row_data = {} row_data['column1'] = row[0] # 第一列数据 row_data['column2'] = row[1] # 第二列数据 data.append(row_data) # 将数据转换为JSON格式 json_data = json.dumps(data, indent=4, ensure_ascii=False) # 将JSON数据保存到文件 with open('data.json', 'w', encoding='utf-8') as file: file.write(json_data) ``` 在上述代码中,data.xlsx是包含Excel数据文件名。通过调用openpyxl库中的load_workbook()函数,加载并打开Excel文件。然后,从工作表中的每一行数据中读取数据,并将其存储在一个列表中。接下来,通过调用json库中的dumps()函数,将数据转换为JSON格式。最后,使用open()函数将JSON数据保存到一个新的文件中,文件名为data.json文件的保存路径可以根据需要进行修改。 ### 回答3: 要使用PythonExcel数据转换成JSON格式,我们可以使用第三方库pandas和xlrd来处理Excel文件。 首先,我们需要安装pandas和xlrd库。可以使用以下命令: ```python pip install pandas xlrd ``` 然后,我们可以使用pandas库中的read_excel函数来读取Excel文件,并将其转换为DataFrame对象。假设Excel文件名为data.xlsx,包含两列数据「列1」和「列2」,可以使用以下代码: ```python import pandas as pd df = pd.read_excel('data.xlsx') ``` 接下来,我们可以使用DataFrame的to_json方法将数据转换为JSON格式。如果想要每个条目作为一个对象,可以指定orient参数为'records'。如果想要将每个条目作为一个列表项,可以指定orient参数为'list'。以下代码将数据转换为JSON字符串并打印出来: ```python json_data = df.to_json(orient='records') print(json_data) ``` 最后,我们可以将JSON字符串写入到文件中,可以使用以下代码: ```python with open('data.json', 'w') as json_file: json_file.write(json_data) ``` 以上就是使用PythonExcel文件转换为JSON格式的基本步骤。通过这种方法,我们可以方便地将Excel数据转换为能够在其他应用程序中使用的JSON格式。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值