【Python自动化办公】用Pandas库自动化操作Excel表格,从读取、写入到数据处理和分析

文末免费赠送精品编程资料~~

前言

Python的第三方Pandas库是数据处理和分析中的利器,其强大的功能可以帮助我们轻松地对Excel表格进行自动化操作。接下来,我们将介绍九个用Pandas库操作Excel的编程例子,并且每个例子都会涉及不同的知识点,确保全面掌握这个主题。

1. 读取和写入Excel文件

首先,我们需要了解如何使用Pandas读取、写入Excel文件。这可以通过pd.read_excel()、df.to_excel()方法来实现。

import pandas as pd   
# 通过字典形式构建DataFrame   
df = pd.DataFrame({
       '工号': [1001,1002,1003],       
       '姓名': ['张三', '李四', '王五'],       
       '年龄': [28, 25, 30]   
       })   
       df = df.set_index('工号')#自定义索引   
       df.to_excel('人事信息.xlsx')#写入excel   
       df = pd.read_excel('人事信息.xlsx')#读取excel   
       print(df)   
       #输出结果:        
       工号  姓名  年龄   
   0  1001  张三  28   
   1  1002  李四  25   
   2  1003  王五  30   

2. 选择特定列数据

要选择Excel表格中的特定列数据,可以使用DataFrame的列索引进行选择。

# 选择Name列数据   
names = df['姓名']   
print(names)   
#输出结果:
   0    张三   
   1    李四   
   2    王五   

3. 选择特定行数据

使用df.loc[]方法可以选择特定行数据。

# 选择第一行数据   
first_row = df.loc[0]   
print(first_row)   
#输出结果:   
工号    1001   
姓名      张三   
年龄      28   

4. 过滤数据

Pandas还可以根据条件过滤数据。

# 过滤年龄大于25的行   
filtered_data = df[df['年龄'] > 25]   
print(filtered_data)   
#输出结果:
        工号  姓名  年龄
    0  1001  张三  28   
    2  1003  王五  30   

5. 添加新列

通过给DataFrame赋值,可以添加新列。

# 添加新列   
df['籍贯'] = ['广东', '广西', '湖南']   
print(df)   
#输出结果:        
工号  姓名  年龄  籍贯   
0  1001  张三  28  广东   
1  1002  李四  25  广西   
2  1003  王五  30  湖南   

6. 删除行或列

使用df.drop()方法可以删除行或列。

# 删除年龄列   
df = df.drop('年龄', axis=1)   
print(df)   
#输出结果: 
       工号  姓名  籍贯
   0  1001  张三  广东   
   1  1002  李四  广西   
   2  1003  王五  湖南   

7. 修改数据

可以通过索引直接修改数据。

# 修改第一行第一个元素为'陈六'   
df.loc[0, '姓名'] = '陈六'   
print(df)   
#输出结果:
        工号  姓名  籍贯
   0  1001  陈六  广东   
   1  1002  李四  广西   
   2  1003  王五  湖南   

8. 合并Excel表格

Pandas可以合并多个Excel表格数据。

# 读取另一个Excel文件   
df2 = pd.read_excel('example2.xlsx')     
 # 合并两个DataFrame   
 merged_df = pd.concat([df, df2])   
 print(merged_df)   

9. 数据透视表

使用Pandas可以生成数据透视表。

# 生成数据透视表   
import pandas as pd   
# 创建销售数据集   
data = {'日期': ['2024-04-01', '2024-04-02', '2024-04-02', '2024-04-02', '2024-04-03'],
           '产品': ['苹果', '香蕉', '苹果', '香蕉', '苹果'],           
           '销售额': [1000, 1500, 800, 1200, 1500]}   
           df = pd.DataFrame(data)   
           # 显示数据集   
           print(df)   
           pivot_table = df.pivot_table(index='日期', columns='产品', values='销售额', aggfunc='sum')     

 # 显示数据透视表   
 print(pivot_table)   
 #数据结果:
    产品              苹果      香蕉   
    日期                           
    2024-04-01  1000.0     NaN   
    2024-04-02   800.0  2700.0   
    2024-04-03  1500.0     NaN   

通过以上九个例子,我们学会了如何使用Python的Pandas库对Excel表格进行自动化操作。从读取、写入到数据处理和分析,Pandas提供了丰富的功能,为数据科学工作提供了便利。希望这些例子能帮助你更好地掌握Pandas库在Excel操作中的应用!如果你觉得这些例子对你的办公自动化有帮助,建议使用https://zglg.work这个网站,会对你很大的帮助哦。

文末福利

最后这里免费分享给大家一份Python全套学习资料,包含视频、源码。课件,希望能帮到那些不满现状,想提升自己却又没有方向的朋友,也可以和我一起来学习交流呀。
在这里插入图片描述

需要的朋友们微信扫描下方CSDN官方认证二维码即可【100%免费获取】。
在这里插入图片描述

  • 9
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值