超强图解 Pandas 18 招!

Pandas是数据挖掘常见的工具,掌握使用过程中的函数是非常重要的。本文将借助可视化的过程,讲解Pandas的各种操作。

sort_values

(dogs[dogs['size'] == 'medium']
 .sort_values('type')
 .groupby('type').median()
)

执行步骤:

  • size列筛选出部分行

  • 然后将行的类型进行转换

  • 按照type列进行分组,计算中位数

ea4f44cdb4edbee79a49c688f9d5b9ca.png1bcf6cf043781ebf6ea183c32a2ef70d.png78be8b13817ed79dfef74e761af48a9b.pngc326611593d42d2b214909840c4e6b87.png

selecting a column

dogs['longevity']

cce69fe66e2b894487ac628296a0c88c.png

groupby + mean

dogs.groupby('size').mean()

执行步骤:

  • 将数据按照size进行分组

  • 在分组内进行聚合操作

1e863a3a5d819244d8c6c7a06687e52d.pngfad21b2b71584a4355818c83a244dac6.png

grouping multiple columns

dogs.groupby(['type', 'size'])

02e30ae7691b4be37b3cc339cceb8945.png

groupby + multi aggregation

(dogs
  .sort_values('size')
  .groupby('size')['height']
  .agg(['sum', 'mean', 'std'])
)

执行步骤

  • 按照size列对数据进行排序

  • 按照size进行分组

  • 对分组内的height进行计算

60e06a54026563de14b04e7242621c40.png9e013ccce39910310f101ba89483ce02.pngf2f39f186c49196eb8fd4bb989c1b948.png671539695bfec146176e3776a538780d.png

filtering for columns

df.loc[:, df.loc['two'] <= 20]

885a3dff67f32472ff267fbd579f417f.png

filtering for rows

dogs.loc[(dogs['size'] == 'medium') & (dogs['longevity'] > 12), 'breed']

ab612b1e2565adb3d3cedc967c5d68e4.png

dropping columns

dogs.drop(columns=['type'])

351b5cb4e3a53058ccb93f1567be60b0.png

joining

ppl.join(dogs)

d57f7d598e0fd5e7fef6abf42758759d.png

merging

ppl.merge(dogs, left_on='likes', right_on='breed', how='left')

909bbacf91414163e8b56f7b3b1611c0.png

pivot table

dogs.pivot_table(index='size', columns='kids', values='price')

9bc3b3f34e6ee1e4cffd2838c73e85f0.png

melting

dogs.melt()

7b9d85cbb1bfb6ac77ddd0a3ab233cb9.png

pivoting

dogs.pivot(index='size', columns='kids')

657c85848fe353567a45e1cd46e9b784.png

stacking column index

dogs.stack()

9e7388e366cba2e084d7463bbdd03619.png

unstacking row index

dogs.unstack()

1757ad487b872ec26547e3b3cf4e1dac.png

resetting index

dogs.reset_index()

de51ab405ef2748ca04a9af02352c97b.png

setting index

dogs.set_index('breed')

51e8492cf219d77ee8f696d37d3e62f9.png

来源:https://pandastutor.com/index.html

 
 
 
 
 
 
 
 
 
 
 
 

END -

 
 
对比Excel系列图书累积销量达15w册,让你轻松掌握数据分析技能,可以点击下方链接进行了解选购:
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值