【Python办公自动化】用Pandas库自动化操作Excel

最新推荐文章于 2024-07-18 10:43:12 发布

大模型扬叔

最新推荐文章于 2024-07-18 10:43:12 发布

阅读量2.1k

点赞数 17

分类专栏：编程 python基础 Python 文章标签： python pandas 自动化 Python办公自动化 Pandas库

本文链接：https://blog.csdn.net/weixin_49895216/article/details/138077656

版权

Python 同时被 3 个专栏收录

227 篇文章 18 订阅

订阅专栏

编程

153 篇文章 2 订阅

订阅专栏

python基础

82 篇文章 5 订阅

订阅专栏

本文详细介绍了如何使用Python的Pandas库进行Excel文件的读写、数据选择、过滤、数据处理、合并以及数据透视表的创建，通过实例展示了Pandas的强大功能，适用于数据科学和自动化操作。

摘要由CSDN通过智能技术生成

前言

Python的第三方Pandas库是数据处理和分析中的利器，其强大的功能可以帮助我们轻松地对Excel表格进行自动化操作。接下来，我们将介绍九个用Pandas库操作Excel的编程例子，并且每个例子都会涉及不同的知识点，确保全面掌握这个主题。

1. 读取和写入Excel文件

首先，我们需要了解如何使用Pandas读取、写入Excel文件。这可以通过pd.read_excel()、df.to_excel()方法来实现。

import pandas as pd
# 通过字典形式构建DataFrame
df = pd.DataFrame({
    '工号': [1001,1002,1003],
    '姓名': ['张三', '李四', '王五'],
    '年龄': [28, 25, 30]
})
df = df.set_index('工号')#自定义索引
df.to_excel('人事信息.xlsx')#写入excel
df = pd.read_excel('人事信息.xlsx')#读取excel
print(df)
#输出结果：
     工号  姓名  年龄
0  1001  张三  28
1  1002  李四  25
2  1003  王五  30

2. 选择特定列数据

要选择Excel表格中的特定列数据，可以使用DataFrame的列索引进行选择。

# 选择Name列数据
names = df['姓名']
print(names)
#输出结果：
0    张三
1    李四
2    王五

3. 选择特定行数据

使用df.loc[]方法可以选择特定行数据。

# 选择第一行数据
first_row = df.loc[0]
print(first_row)
#输出结果：
工号    1001
姓名      张三
年龄      28

4. 过滤数据

Pandas还可以根据条件过滤数据。

# 过滤年龄大于25的行
filtered_data = df[df['年龄'] > 25]
print(filtered_data)
#输出结果：
     工号  姓名  年龄
0  1001  张三  28
2  1003  王五  30

5. 添加新列

通过给DataFrame赋值，可以添加新列。

# 添加新列
df['籍贯'] = ['广东', '广西', '湖南']
print(df)
#输出结果：
     工号  姓名  年龄  籍贯
0  1001  张三  28  广东
1  1002  李四  25  广西
2  1003  王五  30  湖南

6. 删除行或列

使用df.drop()方法可以删除行或列。

# 删除年龄列
df = df.drop('年龄', axis=1)
print(df)
#输出结果：
     工号  姓名  籍贯
0  1001  张三  广东
1  1002  李四  广西
2  1003  王五  湖南

7. 修改数据

可以通过索引直接修改数据。

# 修改第一行第一个元素为'陈六'
df.loc[0, '姓名'] = '陈六'
print(df)
#输出结果：
     工号  姓名  籍贯
0  1001  陈六  广东
1  1002  李四  广西
2  1003  王五  湖南

8. 合并Excel表格

Pandas可以合并多个Excel表格数据。

# 读取另一个Excel文件
df2 = pd.read_excel('example2.xlsx')

# 合并两个DataFrame
merged_df = pd.concat([df, df2])
print(merged_df)

9. 数据透视表

使用Pandas可以生成数据透视表。

# 生成数据透视表
import pandas as pd
# 创建销售数据集
data = {'日期': ['2024-04-01', '2024-04-02', '2024-04-02', '2024-04-02', '2024-04-03'],
        '产品': ['苹果', '香蕉', '苹果', '香蕉', '苹果'],
        '销售额': [1000, 1500, 800, 1200, 1500]}
df = pd.DataFrame(data)
# 显示数据集
print(df)
pivot_table = df.pivot_table(index='日期', columns='产品', values='销售额', aggfunc='sum')

# 显示数据透视表
print(pivot_table)
#数据结果：
产品              苹果      香蕉
日期                        
2024-04-01  1000.0     NaN
2024-04-02   800.0  2700.0
2024-04-03  1500.0     NaN

通过以上九个例子，我们学会了如何使用Python的Pandas库对Excel表格进行自动化操作。从读取、写入到数据处理和分析，Pandas提供了丰富的功能，为数据科学工作提供了便利。希望这些例子能帮助你更好地掌握Pandas库在Excel操作中的应用！

这里给大家分享一份Python全套学习资料，包括学习路线、软件、源码、视频、面试题等等，都是我自己学习时整理的，希望可以对正在学习或者想要学习Python的朋友有帮助！