Python 读取 Excel 数据教程

weixin_51069555

于 2024-09-04 17:45:57 发布

阅读量292

点赞数 3

文章标签： python excel 开发语言

本文链接：https://blog.csdn.net/weixin_51069555/article/details/141899818

版权

在数据科学和分析领域，处理 Excel 文件是日常工作的一部分。Python 提供了多种库来读取和操作 Excel 文件，使得处理这些文件变得非常高效和方便。本文将介绍如何使用 Python 读取 Excel 数据，包括安装必要的库、读取数据、以及一些常见的操作和技巧。

一、安装必要的库

要在 Python 中读取 Excel 文件，你需要安装相应的库。最常用的库包括 pandas 和 openpyxl。pandas 是一个强大的数据分析库，能够轻松处理 Excel 文件，而 openpyxl 是一个用于读写 Excel 文件的库。

可以通过 pip 安装这些库：

bash

pip install pandas openpyxl

二、使用 Pandas 读取 Excel 数据

pandas 是处理 Excel 文件的首选库之一。它提供了简单易用的接口来读取 Excel 文件，并将其转换为 DataFrame 对象，这使得数据分析和处理变得非常方便。

1. 读取 Excel 文件

使用 pandas 的 read_excel 函数可以读取 Excel 文件中的数据。下面是一个基本的示例：

python

import pandas as pd

读取 Excel 文件

df = pd.read_excel('example.xlsx')

打印数据框的前几行

print(df.head())

在这个示例中，read_excel 函数会读取名为 example.xlsx 的 Excel 文件，并将其内容加载到一个 DataFrame 对象中。head() 方法用于查看 DataFrame 的前几行数据。

2. 指定工作表

如果 Excel 文件中有多个工作表，可以使用 sheet_name 参数指定要读取的工作表：

读取指定工作表的数据

df = pd.read_excel('example.xlsx', sheet_name='Sheet1')

打印数据框的前几行

print(df.head())

你也可以传递工作表的索引（从 0 开始）来指定工作表：

读取第一个工作表的数据

df = pd.read_excel('example.xlsx', sheet_name=0)

3. 读取特定的列和行

有时你只需要读取 Excel 文件中的某些列或行。可以使用 usecols 和 skiprows 参数来实现：

读取特定的列

df = pd.read_excel('example.xlsx', usecols=['A', 'B'])

读取指定行（跳过前 2 行）

df = pd.read_excel('example.xlsx', skiprows=2)

三、使用 openpyxl 读取 Excel 数据

openpyxl 是另一个强大的库，用于处理 Excel 文件。它允许你读取和操作 Excel 文件中的各种元素，例如单元格、行和列。

1. 读取 Excel 文件

首先，你需要导入 openpyxl 库，并加载 Excel 文件：

python

from openpyxl import load_workbook

加载 Excel 文件

workbook = load_workbook('example.xlsx')

选择工作表

sheet = workbook.active

打印工作表的前 10 行的第一个单元格的值

for row in sheet.iter_rows(min_row=1, max_row=10, min_col=1, max_col=1):
    for cell in row:
        print(cell.value)

在这个示例中，load_workbook 函数用于加载 Excel 文件，workbook.active 获取当前活动的工作表。iter_rows 方法用于迭代行和列，并打印前 10 行第一个单元格的值。

2. 读取特定的单元格

可以直接访问特定的单元格来读取数据：

读取特定单元格的值（例如 A1）

cell_value = sheet['A1'].value
print(cell_value)

四、处理 Excel 数据的常见操作

1. 筛选数据

使用 pandas 可以轻松筛选 DataFrame 中的数据。例如，筛选出某列值大于 100 的行：

python

筛选数据

filtered_df = df[df['ColumnName'] > 100]

打印筛选后的数据

print(filtered_df)

2. 数据排序

可以对 DataFrame 进行排序：

按照某列进行排序

sorted_df = df.sort_values(by='ColumnName')

打印排序后的数据

print(sorted_df)

3. 数据保存

你可以将处理后的数据保存到新的 Excel 文件中：
将 DataFrame 保存到新的 Excel 文件

df.to_excel('processed_data.xlsx', index=False)

weixin_51069555

关注

3
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
Python 读取 Excel 数据教程

在数据科学和分析领域，处理 Excel 文件是日常工作的一部分。Python 提供了多种库来读取和操作 Excel 文件，使得处理这些文件变得非常高效和方便。本文将介绍如何使用 Python 读取 Excel 数据，包括安装必要的库、读取数据、以及一些常见的操作和技巧。
复制链接

扫一扫