pandas groupby处理技巧

groupby 分组,保留组内符合条件的数据

以下是根据投保单号进行分组,保留组内质检次数最大的一条数据

import pandas as pd
df = pd.read_excel('baoxian.xlsx', dtype=str)
# 获取分组内质检次数最大的数据
df = df.groupby('投保单号').apply(lambda x :  x[x['质检次数'] == x['质检次数'].max()])
# 过滤一次性通过的保单
df = df[(df['质检次数'] == '1') & (df['质检状态'] == '已质检') & (df['质检结论'] == '通过')]

groupby分组,根据特定条件排序,保留第一条数据

  • pandas实现方法
def get_max_month_traget(x):
    """获取最大值的那一行"""
    df = x.sort_values(by='month_target', ascending=False)
    return df.iloc[0, :]

e11 = e1.groupby(["key_customer", "cycle_no"], as_index=False).apply(get_max_month_traget)

  • sql 实现方法
    select *
    from(select 
    *,ROW_NUMBER() over (partition by key_customer,cycle_no order by month_traget desc) as contract_long_rn
        from tdm_vitality_buchong_2
    )t
    where contract_long_rn = 1

cut分桶

例如根据单品销售价格 分为 [“0-1”, “1-3”, “3-5”, “5-10”, “10以上”]

df["单品销售价格段"] = pd.cut(df["单品销售价格"], bins=[0, 1, 3, 5, 10, 500], labels=["0-1", "1-3", "3-5", "5-10", "10以上"])
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
在使用pandasgroupby()方法时,可以结合apply()方法对分组后的数据进行操作。引用中的代码演示了如何对变量df的"品种"列进行聚合,并使用apply()方法打印每个分组后的数据。通过这种方式,我们可以对每个分组进行自定义的操作或计算。引用中的代码演示了如何在groupby()时使用as_index=False参数,以避免结果中产生RangeIndex作为索引。通过这种方式,我们可以获得一个带有自定义列名的结果。引用中的文章则提供了更多关于使用groupby().apply()的案例和技巧。总的来说,pandasgroupby()与apply()的结合可以帮助我们实现更灵活和高级的数据分析和处理。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [python数据分析高阶应用技巧-pandas库聚合案例【 groupby().apply()写法强化】](https://blog.csdn.net/weixin_48964486/article/details/127588129)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* [Pandas.groupby.apply 的一些细节](https://blog.csdn.net/a597688570/article/details/127992318)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值