【在Python中读取Excel文件内容】

学地理的小胖砸

于 2024-08-05 04:30:00 发布

阅读量378

点赞数 14

分类专栏： python 文章标签： python excel 开发语言

本文链接：https://blog.csdn.net/qq_36253366/article/details/140914083

版权

python 专栏收录该内容

147 篇文章 0 订阅

订阅专栏

在Python中读取Excel文件内容，常用的库有xlrd（主要用于读取.xls文件，但不支持.xlsx的较新版本），以及openpyxl（专门用于读取和写入.xlsx文件）和pandas（提供了一个更高级别的接口来处理表格数据，包括Excel文件）。

以下是使用openpyxl和pandas读取Excel文件内容的示例。

使用`openpyxl`

首先，确保你已经安装了openpyxl库。如果未安装，可以通过pip安装：

pip install openpyxl

然后，你可以使用以下代码读取Excel文件：

from openpyxl import load_workbook

# 加载Excel文件
workbook = load_workbook(filename='your_excel_file.xlsx')

# 选择工作表，这里选择第一个工作表
sheet = workbook.active

# 读取数据
for row in sheet.iter_rows(values_only=True):
    print(row)

# 或者，如果你知道要读取哪一行或哪一列
# 读取第一行
first_row = sheet[1]  # 注意：openpyxl中的行和列索引都是从1开始的
print(first_row)

# 读取第一列的所有值
for cell in sheet['A']:
    print(cell.value)

使用`pandas`

pandas库是Python中用于数据分析的一个非常强大的库，它提供了方便的接口来读取Excel文件。首先，确保你已经安装了pandas和openpyxl（因为pandas需要openpyxl来读取.xlsx文件）。

pip install pandas openpyxl

然后，你可以使用以下代码读取Excel文件：

import pandas as pd

# 使用pandas读取Excel文件
df = pd.read_excel('your_excel_file.xlsx', engine='openpyxl')

# 显示前几行数据
print(df.head())

# 如果你只需要读取特定的列，可以使用`usecols`参数
# 例如，读取第一列和第三列（索引从0开始）
df_selected_cols = pd.read_excel('your_excel_file.xlsx', usecols=[0, 2], engine='openpyxl')
print(df_selected_cols.head())

# 如果你需要读取特定的工作表，可以使用`sheet_name`参数
# 例如，读取名为'Sheet2'的工作表
df_sheet2 = pd.read_excel('your_excel_file.xlsx', sheet_name='Sheet2', engine='openpyxl')
print(df_sheet2.head())