干货不看看嘛:比较xlsxwriter/pandas/openpyxl写入excel文件

大家好,这里是Seon塞翁。本文说明如何使用 xlsxwriter/pandas/openpyxl 三个库来实现数据写入 EXCEL,写入后的格式如下图所示:
【图】

以下为数据用例:

import xlsxwriter as xw
import pandas as pd
import openpyxl as op

"-------------数据用例-------------"
orderIds = [1,2,3]
items = ['A','B','C']
myData = [10,20,30]
testData = [orderIds,items,myData]
filename1 = '测试1.xlsx'
filename2 = '测试2.xlsx'
filename3 = '测试3.xlsx'

"--------------执行----------------"
xw_toexcel(testData,filename1)
pd_toexcel(testData,filename2)
op_toexcel(testData,filename3)

下面开始分别介绍三种方法:

1、xlsxwriter

def xw_toexcel(data,filename): # xlsxwriter库储存数据到excel
    workbook = xw.Workbook(filename) # 创建工作簿
    worksheet1 = workbook.add_worksheet("sheet1") # 创建子表
    worksheet1.activate() # 激活表
    title = ['序号','项目','数据'] # 设置表头
    worksheet1.write_row('A1',title) # 从A1单元格开始写入表头
    i = 2 # 从第二行开始写入数据
    for j in range(len(data)):
        insertData = [data[0][j],data[1][j],data[2][j]]
        row = 'A' + str(i)
        worksheet1.write_row(row, insertData)
        i += 1
    workbook.close() # 关闭表

2、pandas

def pd_toexcel(data,filename): # pandas库储存数据到excel
    dfData = { # 用字典设置DataFrame所需数据
        '序号':data[0],
        '项目':data[1],
        '数据':data[2]
    }
    df = pd.DataFrame(dfData) # 创建DataFrame
    df.to_excel(filename,index=False) # 存表,去除原始索引列(0,1,2...)

3、openpyxl

def op_toexcel(data,filename): # openpyxl库储存数据到excel
    wb = op.Workbook() # 创建工作簿对象
    ws = wb['Sheet'] # 创建子表
    ws.append(['序号','项目','数据']) # 添加表头
    for i in range(len(data[0])):
        d = data[0][i], data[1][i], data[2][i]
        ws.append(d) # 每次写入一行
    wb.save(filename)

— 小结 —
openpyxl 与 xlsxwriter 类似,需要逐行写入,如第一行需要得到 [ 1, ‘A’ , 10 ] 的格式,但不同的是使用 openpyxl.load_workbook(filepath) 可以对已存在的 .xlsx 进行追加数据,不会覆盖;pandas 则需先按列组合,如 [[ 1,2,3],[‘A’,‘B’,‘C’],[…]]的格式。方法各有好处,写表时应根据需要选用。

相关补充

1、xlsxwriter按列写入

def xw_toexcel_col(data,filename):
    workbook = xw.Workbook(filename) # 创建工作簿
    worksheet1 = workbook.add_worksheet("sheet1") # 创建子表
    worksheet1.activate() # 激活表
    title = ['序号','项目','数据'] # 设置表头
    worksheet1.write_row('A1',title) # 从A1单元格开始写入表头
    letters = ['A', 'B', 'C']
    for index, insertData in enumerate(testData):
        col = letters[index] + '2' # 分别从A2、B2、C2写入列
        worksheet1.write_column(col,insertData)
    workbook.close() # 关闭表

另外可以使用以下代码生成完整大写字母表:

letter_list = [chr(x).upper() for x in range(ord(‘a’), ord(‘z’) + 1)]

2、pandas追加数据

pandas 结合 openpyxl 也可以实现向已存在的 Excel 表中追加数据,使用以下代码注意还需再 import os,因为 op.load_workbook 无法加载不存在的文件,初次写表需先用 to_excel()

def pd_op_toexcel(data, filepath):
    dfData = {  # 用字典设置DataFrame所需数据
        '序号': data[0],
        '项目': data[1],
        '数据': data[2]
    }
    df = pd.DataFrame(dfData)  # 创建DataFrame
    if not os.path.exists(filepath):  # 不存在则创建新的
        df.to_excel(filename, index=False)
    else:
        book = op.load_workbook(filepath)  # 加载已存在的工作簿对象
        writer = pd.ExcelWriter(filepath, engine='openpyxl')  # 使用openpyxl引擎的写表器
        writer.book = book
        df.to_excel(writer, index=False)
        writer.save()

执行三次后的效果如下图所示,该写表器每次会将数据写入一个新的子表,新子表的默认命名为第一个子表名后加序号。
在这里插入图片描述

3、openpyxl追加数据

def op_toexcel_more(data, filepath): 
    if not os.path.exists(filepath):
        wb = op.Workbook()  # 创建工作簿对象
        ws = wb['Sheet']  # 创建子表
        ws.append(['序号', '项目', '数据'])  # 添加表头
        for i in range(len(data[0])):
            d = data[0][i], data[1][i], data[2][i]
            ws.append(d)  # 每次写入一行
        wb.save(filepath)
    else:
        book = op.load_workbook(filepath)
        sheet = book.active  # 获取子表
        for i in range(len(data[0])):
            d = data[0][i], data[1][i], data[2][i]
            sheet.append(d) # 子表添加行
        book.save(filepath)

执行三次后的效果如下图所示:
在这里插入图片描述

### 解决方案 当使用 `xlrd` 库读取 `.xlsx` 文件时,如果遇到 `'not supported'` 的错误提示,则表明当前使用的 `xlrd` 版本可能过高。自 `xlrd` 2.0.1 起,该库再支持 `.xlsx` 文件的解析[^4]。 #### 替代方法一:降级 `xlrd` 可以尝试将 `xlrd` 升级到较低版本(如 1.2.0),此版本仍然兼容 `.xls` 和 `.xlsx` 文件: ```bash pip install xlrd==1.2.0 ``` 完成安装后重新运行代码即可正常工作。 --- #### 替代方法二:改用其他库 由于 `xlrd` 已停止更新并逐渐被淘汰,推荐使用更现代的工具来处理 Excel 文件,例如 `openpyxl` 或 `pandas`。 ##### 方法 A: 使用 `openpyxl` `openpyxl` 是专门用于操作 `.xlsx` 文件的库。以下是其基本用法示例: ```python from openpyxl import load_workbook # 加载文件 workbook = load_workbook('文件.xlsx') # 获取活动的工作表 sheet = workbook.active # 遍历单元格数据 for row in sheet.iter_rows(values_only=True): print(row) ``` 注意:`openpyxl` 支持 `.xls` 文件,仅适用于 `.xlsx` 格式的文档[^3]。 ##### 方法 B: 使用 `pandas` `pandas` 提供了一个简单易用的方法来加载 Excel 数据,并自动检测所需的引擎(如 `openpyxl`)。以下是一个例子: ```python import pandas as pd # 自动选择合适的引擎读取文件 dataframe = pd.read_excel('文件.xlsx', engine='openpyxl') print(dataframe.head()) ``` 在此情况下,需确保已安装依赖项 `openpyxl`: ```bash pip install pandas openpyxl ``` --- ### 总结 - 如果坚持使用 `xlrd`,则应将其版本回退至 1.2.0。 - 推荐采用功能更强且仍在维护中的替代品,比如 `openpyxl` 或者结合 `pandas` 进行开发。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值