代码
# 导入这个神奇的包
import pandas as pd
# 参考这个文档 https://pandas.pydata.org/pandas-docs/version/0.22/groupby.html
# io 是文件
# sheet_name 选择excel 的sheet
# usecols 选择当前sheet 的前几列
# names 给每列定义一个名字
df1 = pd.read_excel(io="E:\\haha\\测试数据.xlsx",sheet_name="Sheet2",usecols=[0,1,2,3],names=["Sample", "Raw_Bases_Number", "dt", "id"])
# 定义一个计算公式
data_range = lambda x: x.max() - x.min()
# 根据指定字段分组,agg是聚合部分,聚合的是 Raw_Bases_Number 字段,聚合结果是 最大值、最小值、和上面定义的函数
groupData = df1.groupby("id").agg({"Raw_Bases_Number" : ['max','min',data_range]})
# 打印一下,猫一眼是啥东西
print(groupData)
# 输出
groupData.to_excel("E:\\haha\\result.xlsx")