pandas基本应用记录

查询行数和列数

data.describe()

查询前3行数据

data.head(3)

打印第几行第几列

data.loc[index,  cloumn_name ]

分组统计 不带行索引

data.groupby( column_1 )[ column_2 ].apply(sum)

去除含有NAN数据行/列

df = df.dropna()  # default: axis=0, how='any' 意思是只要有nan,就删除一行,how='any|all';若how='all',则代表当一行全为nan,才会删除。若把axis=0改为1,则代表删除列。

删除数据中重复值

drop_duplicates函数 :

数据合并:

提供了concat,merge,join和append四种方法用于dataframe的拼接

过滤属性:

filter(items=['列名1','列名2']) 

用正则过滤

data.filter(regex="", axis=1)

iterrows函数用于对DataFrame进行迭代循环

 删除列

pd.pop('列名')

根据字段类型来筛选数据,可以包含或者排除一个或者多个字段类型的数据。

查询包含多列类型的数据

pd.select_dtypes(include=['列名','列名'])

查询不包含多列类型的数据

pd.select_dtypes(exclude=['列名','列名'])

select_dtypes()

查看每列的数据类型

pd.dtypes

 进行比较的一个函数:ge表示greater equal

数据求和

expanding 这是一个窗口函数,实现的是一种类似累计求和的功能

pd.expanding(1).sum()

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值