pandas 多列之间运算

6 篇文章 0 订阅
3 篇文章 0 订阅

单列运算
在Pandas中,DataFrame的一列就是一个Series, 可以通过map来对一列进行操作:

df['new_col'] = df['col1'].map(lambda x: x**2)

多列运算
要对DataFrame的多个列同时进行运算,可以使用apply,例如new_col= col1 + col2:

df['new_col'] = df.apply(lambda x: x['col1'] +  x['col2'], axis=1)

分组运算
可以结合groupby与transform来方便地实现类似SQL中的聚合运算的操作:

df['new_col'] = df.groupby('col1')['col2'].transform(lambda x: (x.sum() - x) / x.count())

在transform函数中x.sum()与x.count()与SQL类似,计算的是当前group中的和与数量,还可以将transform的结果作为一个一个映射来使用, 例如:

sumcount = df.groupby('col1')['col2'].transform(lambda x: x.sum() + x.count())
 
df['col1'].map(sumcount)

对col1进行一个map,得到对应的col2的运算值

聚合函数
结合groupby与agg实现SQL中的分组聚合运算操作,需要使用相应的聚合函数:

df['col2'] = df.groupby('col1').agg({'col1':{'col1_mean': mean, 'col1_sum‘’: sum}, 'col2': {'col2_count': count}})

上述代码生成了col1_mean, col1_sum与col2_count列。

  • 1
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值