- 导入 openpyxl 库,用于操作 Excel 文件。
- 使用 openpyxl.load_workbook() 打开 Excel 文件。
- 获取活动工作表 sheet = workbook.active。
- 定义一个空列表 data 用于存储每一行的数据。
- 指定从第 2 行开始读取数据 start_row = 2。
- 使用 sheet.iter_rows() 遍历每一行数据,将每一行数据存储为一个字典,并添加到 data 列表中。
- 最后,关闭 Excel 文件 workbook.close()。
- 在最后的循环中,可以对 data 列表中的每一个字典进行处理。
- 这段代码可以完整地读取 Excel 表格中的数据,并将其存储在 data 列表中,供后续处理使用。
import openpyxl #首先导入openpyxl库
workbook = openpyxl.load_workbook('文件路径') # 打开 Excel 文件
sheet = workbook.active # 选择第一个工作表
data = [] # 定义一个用于存储每一行数据的列表
start_row = 2 # 指定起始行数
# 遍历每一行并读取每一列的数据 存储到 字典中
for row in sheet.iter_rows(min_row=start_row, values_only=True):
enterprise = {
"key1": row[0],
"key2": row[1],
"key3": row[2],
"key4": row[3],
"key5": row[4],
"key6": row[5],
"key7": row[6],
"key8": row[7],
"key9": row[8],
"key10":str(row[9]),
"key11":str(row[10])
}
data.append(enterprise) #将每一行的字典放入data列表中
# 最后关闭 Excel 文件
workbook.close()
for enterprise in data:
读取表格中每一行的数据
详细讲一下iter_rows()方法:iter_rows()
是 openpyxl
库中的一个方法,用于遍历 Excel 工作表中的行数据。以下是对该方法的详细说明:
iter_rows(min_row=None, max_row=None, min_col=None, max_col=None, values_only=False)
-
参数:
min_row
: 指定要遍历的最小行号。如果不设置,默认从第 1 行开始。max_row
: 指定要遍历的最大行号。如果不设置,默认遍历到最后一行。min_col
: 指定要遍历的最小列号。如果不设置,默认从第 1 列开始。max_col
: 指定要遍历的最大列号。如果不设置,默认遍历到最后一列。values_only
: 如果设置为True
,则只返回单元格的值,而不返回单元格对象。
2. 返回值:iter_rows() 方法返回一个生成器对象,该对象可以逐行遍历 Excel 工作表中的单元格。每一行都是一个元组,包含该行中每个单元格的值。