前言
上一篇(戳我查看)Pandas的语句介绍到DataFrame的滑片,这篇就继续介绍Pandas中的一些基本语句。
数据清洗
df.columns = ['a','b','c'] # 重命名列名称
pd.isnull() # 检查是否为null值,为null返回True,不为null返回False
pd.notnull() # 检查是否为null值,为null返回False,不为null返回True
df.dropna(axis=0) # 删掉所有含有null值的行,axis默认为0,此处可以不指定
df.dropna(axis=1) # 删掉所有含有null值的列
df.dropna(axis=1,thresh=n) # 删掉所有含有n个以上null值的列
df.fillna(x) # 用x的值填充所有null值
s.fillna(s.mean()) # 用该列的平均值替换掉null值,其中mean()可以换成任意函数,
# 如std(),min(),max()等
s.astype(float) # 将数据类型转换为float,可将float替换为int,object等