Python 读取Excel数据并分组统计

代码


# 导入这个神奇的包
import pandas as pd

# 参考这个文档 https://pandas.pydata.org/pandas-docs/version/0.22/groupby.html
# io 是文件
# sheet_name 选择excel 的sheet
# usecols 选择当前sheet 的前几列
# names 给每列定义一个名字
df1 = pd.read_excel(io="E:\\haha\\测试数据.xlsx",sheet_name="Sheet2",usecols=[0,1,2,3],names=["Sample", "Raw_Bases_Number", "dt", "id"])

# 定义一个计算公式
data_range = lambda x: x.max() - x.min()

# 根据指定字段分组,agg是聚合部分,聚合的是 Raw_Bases_Number 字段,聚合结果是 最大值、最小值、和上面定义的函数
groupData = df1.groupby("id").agg({"Raw_Bases_Number" : ['max','min',data_range]})

# 打印一下,猫一眼是啥东西
print(groupData)
# 输出
groupData.to_excel("E:\\haha\\result.xlsx")

 

  • 2
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值