python pandas模块的功能_python之pandas模块高级用法

一 agg,聚合,可以使用内置的函数

>>> import pandas as pd

>>> import numpy as np

>>> pp = pd.DataFrame(np.random.randn(10, 3), columns=['A', 'B', 'C'],index=pd.date_range('1/1/2000', periods=10))

>>> pp

A B C

2000-01-01 0.754524 -0.855136 0.135573

2000-01-02 0.224428 -2.025685 0.590259

2000-01-03 -0.894270 1.956547 -0.515041

2000-01-04 0.794662 0.005409 -1.846422

2000-01-05 0.808849 1.283276 -0.681725

2000-01-06 0.538258 -0.249534 0.217653

2000-01-07 0.582666 -0.656912 -0.780406

2000-01-08 -0.981985 1.125303 0.230330

2000-01-09 1.303636 0.806432 0.556127

2000-01-10 -1.207910 2.382836 0.959141

>>> pp.iloc[3:7]=np.nan #直接给赋值

>>> pp

A B C

2000-01-01 0.754524 -0.855136 0.135573

2000-01-02 0.224428 -2.025685 0.590259

2000-01-03 -0.894270 1.956547 -0.515041

2000-01-04 NaN NaN NaN

2000-01-05 NaN NaN NaN

2000-01-06 NaN NaN NaN

2000-01-07 NaN NaN NaN

2000-01-08 -0.981985 1.125303 0.230330

2000-01-09 1.303636 0.806432 0.556127

2000-01-10 -1.207910 2.382836 0.959141

>>> pp.agg(np.sum) #使用方法一

A -0.801575

B 3.390298

C 1.956388

dtype: float64

>>> pp.agg('sum') #使用方法二

A -0.801575

B 3.390298

C 1.956388

dtype: float64

>>> pp.A.agg('sum') #给当个列使用

-0.8015753184519548

>>> tsdf.agg({'A':['mean','sum'],'B':'sum'}) #分别对列进行多个或单个函数计算

A B

mean -0.133596 NaN

sum -0.801575 3.390298

标签:pp,01,python,sum,NaN,agg,2000,模块,pandas

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值