Pandas 数据处理的基本方法

import pandas as pd,其中pd.Series()类似与python中的字典,可传入字典构造。支持相应的切片,若切片值为index则前后区间都包括在内:d[“123”]或者d[" “:” “]表示两个index之前的全部数,显示索引;若是数字切片,d[0:2]贼左闭右包,隐式索引
在这里插入图片描述
np.DataFrame()类似于两个Series进行叠加,行列都有索引。m=np.DataFrame({” 45":d})(d为一个Series)其中,m.index放回行的标签,m.colums返回列的标签。其中m[“col0”]返回第一列的值,m[0]在数组中则是返回第一个数的值。其中,某些键的之不存在,pd会自动补充NaN。或者时pd.DtaFrame(二维数组,[index=[],clunms=[]])也可以创建DataFrame数组形式。
ind=np.Index()可以构造出index的数组,与numpy的array类似,唯一区别就是不要变ind[1]=2,就会报错。
pd可以像字典一样改变值或者输出:d.keys(),d.items()d[“56”]=12

操作时:loc取值和索引都是显示;iloc取值和索引都是隐式。
DataFrame数据选择方法:
data[index]#索引;data.index#属性值
data.values#看成数组进行按行查看数组数据,返回一个二维数组,然后就可以按照数组进行操作
可以直接使用掩码,对数据直接进行过滤:data[data[“index”]>100],可以与numpy结合使用,运用通用函数。
df=pd.DataFrame() df.add(),df.mul()/df.multiply(),df.sub()/df.subtract(),df.mod(),df.pow()与numpy中的运算相对应。
pands对缺失值的处理:
None:类型,object类型
NaN:数值型缺失值,任何操作的结果都为NaN。
isnull(),notnull()进行判断。
data.isnull()#返回对应位上的true与false,data[data.notnull()]#返回非空的数据
剔除缺失值:
data.dropna()#默认提出包含nan的一整行数据,也可以填进去参数:data.dropna(axis= ,how=“any”/“all”,thresh=)
data.fillna()#对缺失值进行填充np.DataFrame( ‘’’’’’’,fill_value=0)也可以进行填充data.fillna(method=“ffill"or"bfill”)#ffill:利用前面的值进行填充;bfill:利用从后往前的值进行填充。
多级索引:MultiIndex----data.unstack()#将多级索引快速变为普通DataFrame数据结构
data.stack()#将行列索引的DataFrame快速变为一个多级索引
data.groupby(" “)#返回一个groupby对象,可以认为其为一个DataFrame
高性能运算:
pd.eval(” ")#算术运算、比较运算。。。。。括号里面需要在引号中进行,字符进行

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值