Python 读取Excel数据并分组统计

最新推荐文章于 2024-07-26 10:52:40 发布

风少年~

最新推荐文章于 2024-07-26 10:52:40 发布

阅读量7.2k

点赞数 2

分类专栏： Python学一点

本文链接：https://blog.csdn.net/albg_boy/article/details/103156641

版权

Python学一点专栏收录该内容

17 篇文章 3 订阅

订阅专栏

代码


# 导入这个神奇的包
import pandas as pd

# 参考这个文档 https://pandas.pydata.org/pandas-docs/version/0.22/groupby.html
# io 是文件
# sheet_name 选择excel 的sheet
# usecols 选择当前sheet 的前几列
# names 给每列定义一个名字
df1 = pd.read_excel(io="E:\\haha\\测试数据.xlsx",sheet_name="Sheet2",usecols=[0,1,2,3],names=["Sample", "Raw_Bases_Number", "dt", "id"])

# 定义一个计算公式
data_range = lambda x: x.max() - x.min()

# 根据指定字段分组，agg是聚合部分，聚合的是 Raw_Bases_Number 字段，聚合结果是 最大值、最小值、和上面定义的函数
groupData = df1.groupby("id").agg({"Raw_Bases_Number" : ['max','min',data_range]})

# 打印一下，猫一眼是啥东西
print(groupData)
# 输出
groupData.to_excel("E:\\haha\\result.xlsx")