pandas groupby 将数据连续分为n个一组及排号分组

pandas似乎没有直接的方法对数据进行n个一组的聚合,这里讨论实现的方法。

思路是添加一列 group label 'g_i',连续n个一组,然后根据 group label 聚合即可。

def group_by_n(df,n):

    n_g = int(np.floor(len(df)/n))

    g_i = []

    for i in range(n_g):

        g_i += [i]*n

    for i in range(len(df)-n*n_g):

        g_i += [n_g]

    df['g_i'] = g_i

group_by_n(df)

df.groupby('g_i')

核心在于获取组的数量n_g,类似的可以进行间隔分组,将数据相继编号为1,2,3...n,并重复循环,对编号相同的数据聚合(类似于排队报数,报到相同数的分为一组)

def select_by_n(df,n):

    n_g = int(np.floor(len(df)/n))

    s_i = list(range(n))*n_g

    for i in range(len(df)-n*n_g):

        s_i += [i]

    df['s_i'] = s_i

select_by_n(df)

df.groupby('s_i')

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值