探索Pandas库在Excel数据处理中的应用

最新推荐文章于 2024-06-17 16:42:03 发布

訾博ZiBo

最新推荐文章于 2024-06-17 16:42:03 发布

阅读量430

点赞数 5

分类专栏： Pandas 文章标签： pandas excel python

本文链接：https://blog.csdn.net/qq_29689343/article/details/139164407

版权

Pandas 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

探索Pandas库在Excel数据处理中的应用

文章目录

探索Pandas库在Excel数据处理中的应用

在数据分析领域，Pandas库因其强大的数据处理能力而广受欢迎。今天，我们将通过一个简单的示例来探索如何使用Pandas来处理Excel文件。这个示例将涵盖从读取Excel文件到修改、筛选和保存数据的全过程。

读取Excel文件

首先，我们需要导入Pandas库，并读取Excel文件。假设我们有一个名为data.xlsx的文件，我们可以使用以下代码来读取它：

import pandas as pd

# 读取Excel文件
df = pd.read_excel('data.xlsx')

查看Sheet列表

Excel文件可能包含多个Sheet，我们可以使用以下代码来查看所有的Sheet名称：

# 查看sheet列表
print(pd.ExcelFile('data.xlsx').sheet_names)

读取指定Sheet的数据

如果我们只对特定的Sheet感兴趣，可以指定sheet_name参数来读取：

# 读取指定sheet的数据
df2 = pd.read_excel('data.xlsx', sheet_name='Sheet1')

查看数据

Pandas提供了多种方法来查看数据的不同部分：

# 查看全部行
print(df)

# 查看前1行
print(df.head(1))

# 查看最后1行
print(df.tail(1))

# 查看全部列
print(df.columns)

# 查看指定列全部数据
print(df['name'])

# 查看指定列前1行数据
print(df['name'].head(1))

# 查看指定列最后1行数据
print(df['name'].tail(1))

修改数据

Pandas允许我们轻松地修改数据：

# 查看指定行指定列的数据
print(df.loc[0, 'name'])

# 修改指定整行的数据
df.loc[0] = ['John', 25, 100]
print(df.head(1))

# 修改指定行指定列的数据
df.loc[0, 'name'] = 'Kock'
print(df.head(1))

# 修改指定条件行的数据
df.loc[df['age'] > 30, 'name'] = 'Adult'
print(df['name'])

新增数据

我们可以向DataFrame中添加新的行或多行数据：

# 新增一行数据
print(len(df))
df.loc[len(df.index)] = ['John999', 99, 999]
print(df.tail(1))
print(len(df))

# 新增多行数据
df_new = pd.DataFrame({'name': ['John1000', 'John1001', 'John1002'], 'age': [1000, 1001, 1002], 'number': [10000, 10010, 10020]})
df = pd.concat([df, df_new])

删除数据

删除不需要的行或列也是常见的操作：

# 删除指定整行数据
df = df.drop([14])
print(df.tail(1))

# 删除指定条件行数据
df = df.drop(df[df['age'] > 32].index)
print(df)

# 删除指定列数据
df = df.drop(['number'], axis=1)

# 删除重复行数据
df = df.drop_duplicates()

# 删除指定列重复行数据
df = df.drop_duplicates(subset=['name'])

重置索引

在删除数据后，重置索引是一个好习惯：

# 重置索引
df = df.reset_index(drop=True)

排序和筛选数据

Pandas提供了强大的排序和筛选功能：

# 排序数据
df = df.sort_values(by='age')

# 筛选数据
df = df[df['age'] > 30]

# 筛选数据并排序
df = df.sort_values(by='age')[df['age'] > 30]

# 筛选数据并排序并重置索引
df = df.sort_values(by='age')[df['age'] > 30].reset_index(drop=True)

查看数据类型

了解数据的类型对于数据分析至关重要：

# 查看数据类型
print(df.dtypes)

保存修改后的数据

最后，我们可以将修改后的数据保存回Excel文件：

# 保存修改后的数据
df.to_excel('data_modified.xlsx', index=False)

通过这个示例，我们可以看到Pandas在处理Excel数据时的强大功能。无论是数据的读取、修改、筛选还是保存，Pandas都提供了简洁而高效的方法。希望这个示例能帮助你更好地利用Pandas来处理你的数据。

訾博ZiBo

关注

5
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
探索Pandas库在Excel数据处理中的应用

在数据分析领域，Pandas库因其强大的数据处理能力而广受欢迎。今天，我们将通过一个简单的示例来探索如何使用Pandas来处理Excel文件。这个示例将涵盖从读取Excel文件到修改、筛选和保存数据的全过程。
复制链接

扫一扫