分析数据免不了遇到很多空值的情况,如果想去除这些空值,pandas设置了专门的函数:dropna(),下面将对dropna()进行详细的介绍
dropna()
需要重点掌握的知识点:
- 第一点需要确定的参数就是axis,0:行,1:列
- 当inplace=True时,how建议设置为"all"
- 建议采用默认返回新对象的方法,不要对原始数据进行修改
- subset建议每次都用上,更有针对性
- thresh为非空的值得数量,小于该数量将会被删除
首先需要判断是否含有空值:
- isna()
df.isna()
结果
- isnull()
df.isnull()
结果
判断是否全部为空:
- isna().any()or isnull.any(),两个函数是一样的
df.isnull().any()
结果:
判断某一列是否为空:
df['toy'].isnull()
df['toy'].isnull().any()