python pandas stack_Python 数据分析之 pandas 进阶(二)

最新推荐文章于 2023-04-05 20:40:37 发布

weixin_39665787

最新推荐文章于 2023-04-05 20:40:37 发布

阅读量115

点赞数

文章标签： python pandas stack

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39665787/article/details/111427155

版权

六、分组

对于“group by”操作，我们通常是指以下一个或多个操作步骤：

(Splitting)按照一些规则将数据分为不同的组

(Applying)对于每组数据分别执行一个函数

(Combining)将结果组合刀一个数据结构中

将要处理的数组是：

df = pd.DataFrame({

'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'],

'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'],

'C': np.random.randn(8),

'D': np.random.randn(8)

})

df

A B C D

0 foo one 0.961295 -0.281012

1 bar one 0.901454 0.621284

2 foo two -0.584834 0.919414

3 bar three 1.259104 -1.012103

4 foo two 0.153107 1.108028

5 bar two 0.115963 1.333981

6 foo one 1.421895 -1.456916

7 foo three -2.103125 -1.757291

1、分组并对每个分组执行sum函数：

df.groupby('A').sum()

C D

A

bar 2.276522 0.943161

foo -0.151661 -1.467777

2、通过多个列进行分组形成一个层次索引，然后执行函数：

df.groupby(['A', 'B']).sum()

C D

A B

bar one 0.901454 0.621284

three 1.259104 -1.012103

two 0.115963 1.333981

foo one 2.383191 -1.737928

three -2.103125 -1.757291

two -0.431727 2.027441

七、Reshaping

Stack

tuples = list(zip(*[['bar', 'bar', 'baz', 'baz',

'foo', 'foo', 'qux', 'qux'],

['one', 'two', 'one', 'two',

'one', 'two', 'one', 'two']]))

tuples

[('bar', 'one'),

('bar', 'two'),

(

最低0.47元/天解锁文章

weixin_39665787

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python pandas stack_Python 数据分析之 pandas 进阶(二)

六、分组对于“group by”操作，我们通常是指以下一个或多个操作步骤：(Splitting)按照一些规则将数据分为不同的组(Applying)对于每组数据分别执行一个函数(Combining)将结果组合刀一个数据结构中将要处理的数组是：df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo']...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。