是否为空值
df.isnull() ##是为空值
df.notnull() ## 不会空值的数据
删除列
df.drop[‘column.name’]
del row with nan
df.dropna()
del row with definition row
df.dropna(axis=1,thresh=3)
del 重复值项
df.duplicated ##检查是否有重复
df.drop_duplicated() ## 删除行
df.drop_duplicated([‘a’]) ##按照某列的重复值进行删除
fill na
df.fillna(0)
df.fillna({1:0,2:0.5})
df.fillna(method=’ffill’) 上面的值填充给nan
order
row and index for order
df.sort_index() ## 进行rowid 进行排序
df.sort_index(axis=1,ascending=False) ##进行降序排序
df.sort_index(by=[‘col1’]) ## 按名称进行排序
df.sort_index(by=[‘col1’,‘col2’]) ## 按名称进行排序
df.sort_index(axis=1) ## 按行进行排序
caculate
df.sum()
df.mean()
df.sum(axis=1) ##对行进行求和
map(将一些值映射进行变换)
condition={‘a’:1,’b’:2