前言
对pandas常用的函数进行了一下汇总,供自己以后回顾使用。
一、缺失数据(NaN)
df.fillna()#对DataFrame中的nan进行填充,一般会使用df.mean()或df.median()进行填充,而不是具体数字
pd.isnull(df)#DataFrame中是否有nan
pd.notnull(df)#DataFrame中是否没有nan
df.dropna(axis=0或1, how="all"或"any",inplace="False"或"True")#以什么样的策略对DataFrame中的nan进行丢弃
二、pandas和Numpy在数值中对于NaN的处理策略
pandas在数值中处理nan会将nan去掉,计算均值或者求和会忽略nan
Numpy在数值中处理nan时,不管是什么数据,结果都是nan
三、给数据赋值nan
pandas中给数据赋值nan可以直接进行,不用考虑数据类型
Numpy中给数据复制nan需要先将数据转为float