超强图解Pandas

↑ 点击蓝字 关注公众号领取资料

Pandas是数据挖掘常见的工具,掌握使用过程中的函数是非常重要的。本文将借助可视化的过程,讲解Pandas的各种操作。

sort_values

(dogs[dogs['size'] == 'medium']
 .sort_values('type')
 .groupby('type').median()
)

执行步骤:

  • size列筛选出部分行

  • 然后将行的类型进行转换

  • 按照type列进行分组,计算中位数

377ca1667f05a5a6a0082e8ae68ec4b4.png

307f023026f445450783087aeaaa11e0.png

af02f851ed6df9794fd0039cb4c3c947.png

560a36309abc786748fb390b4c5c10d1.png

selecting a column

dogs['longevity']

eeaf838081634381a600aabc7f806483.png

groupby + mean

dogs.groupby('size').mean()

执行步骤:

  • 将数据按照size进行分组

  • 在分组内进行聚合操作

ac1d27bc039970ee69d8a26744221d2a.png

9744c7196760de017268e09b909f0e08.png

grouping multiple columns

dogs.groupby(['type', 'size'])

ccaf9d3873cbada2b966e3a21ef3cd87.png

groupby + multi aggregation

(dogs
  .sort_values('size')
  .groupby('size')['height']
  .agg(['sum', 'mean', 'std'])
)

执行步骤

  • 按照size列对数据进行排序

  • 按照size进行分组

  • 对分组内的height进行计算

d675fc36cddba433b3d95993d1d7b1c8.png

cee0170025f4f69a3ad31d2f4dc42c31.png

2529db44a9bbcf500fee6899faccccf2.png

5a032237fd80cde8cb35b1d49a097559.png

filtering for columns

df.loc[:, df.loc['two'] <= 20]

7ed96d8a69a9a28691d33155114e7520.png

filtering for rows

dogs.loc[(dogs['size'] == 'medium') & (dogs['longevity'] > 12), 'breed']

254ac6ea87f3c36c82a8ff6b6f2794ee.png

dropping columns

dogs.drop(columns=['type'])

cbd8afe47f0fe88666c5092ba9dce54c.png

joining

ppl.join(dogs)

7d5bfcf461634ed79473a3b9aa6da4e1.png

merging

ppl.merge(dogs, left_on='likes', right_on='breed', how='left')

f5b7b6effe6d3265f3d77e9f835a555b.png

pivot table

dogs.pivot_table(index='size', columns='kids', values='price')

0e176e44286644e041df622cb63b590f.png

melting

dogs.melt()

4ea80de54b0518dc0725513bae254c28.png

pivoting

dogs.pivot(index='size', columns='kids')

8422acc07863af8355ff3a3ff578cc00.png

stacking column index

dogs.stack()

f9a6832ef90ab47b97821d67d7a8988a.png

unstacking row index

dogs.unstack()

c2109ec292c72881ca0f8702b5019592.png

resetting index

dogs.reset_index()

fcbd7975ff4270c0af935e5a71a26678.png

setting index

dogs.set_index('breed')

5cf1f52597a3da465e629e2636b522ce.png

文章原文:https://pandastutor.com/index.html

推荐阅读

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值