【繁琐工作自动化】pandas 处理 excel 文件

0. 一般处理

  • 读取 excel 格式文件:df = pd.read_excel(‘xx.xlsx’),下面是一些简单查看文件内容的函数:
    • df.head():展示前五行;
    • df.columns:展示所有的列名,也即属性名;
  • 简单统计处理:

    • 求某列元素的最大最小平均值,最大最小值所在的行号;
    df['col_name'].argmax(), df['col_name'].max()
    df['col_name'].argmin(), df['col_name'].min()
    df['col_name'].mean()

1. 多 sheet 的读取

import pandas
df = pandas.read_excel(open('your_xls_xlsx_filename','rb'), sheetname='Sheet 1')            
    # 使用 sheet 名

# or using sheet index starting 0
df = pandas.read_excel(open('your_xls_xlsx_filename','rb'), sheetname=2)                    
    # 使用 sheet 所在的索引     

2. 使用 ExcelFile 类

Using Pandas to pd.read_excel() for multiple worksheets of the same workbook

  • pd.read_excel() ⇒ 将 excel 的第一个 sheet 读取到 DataFrame
  • 使用 ExcelFile 对象:

    xls = pd.ExcelFile('excel_file_path.xls')
    xls.sheet_names     # 获取各个 sheet 的名字
    sheet_df = xls.parse(0)
  • Tricks:将 sheet 读入到字典中,通过 sheet 名索引:

    sheet_map = {}
    for sheet_name in xls.sheet_names:
        sheet_map[sheet_name] = xls.parse(sheet_name)
  • 0
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

五道口纳什

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值