openpyxl和pandas简单比对

最新推荐文章于 2024-07-20 05:04:23 发布

hxchuadian

最新推荐文章于 2024-07-20 05:04:23 发布

阅读量6.8k

点赞数 4

文章标签：大数据 python

本文链接：https://blog.csdn.net/hxchuadian/article/details/125826197

版权

本文对比了Python中pandas和openpyxl在处理Excel数据时的读取效率和数据整理能力。在读取83*20的稀疏矩阵数据集时，openpyxl表现出更高的效率。pandas虽然适合数据探索和转换，但在面对复杂表格结构时，openpyxl的预处理更便捷。建议先用openpyxl整理数据，再用pandas进行深入分析。

摘要由CSDN通过智能技术生成

关于Excel数据处理，Pyhton有pandas库和openpyxl、xlwings 模块模块可以对Excel数据进行处理，下面对pandas和openpyxl处理数据进行简单比对。

1、读取效率

我们采用83*20的数据集（该数据集为稀疏矩阵）进行读取数据的耗时统计。

pandas代码如下：

import time
import numpy as np
import pandas as pd
start_time = time.time()
wb = pd.read_excel('C:/Users/.../职协/职协招新/9_扫楼总工作表(1).xlsx')
print(wb)
end_time = time.time()
print(end_time - start_time)

结果为：

openpyxl代码如下：

# 导入模块，查看属性
import openpyxl
root_path = 'C:/Users/10692/Desktop/职协/职协招新/'
wb = openpyxl.load_workbook(root_path + '9_扫楼总工作表(1).xlsx')
import time
start_time = time.time()

sheet = wb.active
for column in sheet.columns:
    for cell in column:
        print(cell.value, end=', ')
    print()

end_time = time.time()
print(end_time - start_time)

结果为：