今天说下pandas最常用函数之一dropna()函数
该函数主要用于过滤去除缺失数据的列或者行
公式
xx.dropna()
这里区分两种情况数据类型,对Series或者DataFrame
1.对于Series,则返回一个仅含非空数值和index的Series,
** data[column_name].dropna() **
例如
# 对于Series
data['update_level'].dropna()
运行结果:
2.对于DataFrame
** data[column_name].dropna() **
# axis=0或者1 可控制删除全为缺失值的行或者列 默认为axis=0 为行
data.dropna(how='all') # 删除所有为缺失值的空行
data.dropna(axis=1, how='all') # 删除全为缺失值的那些列
data.dropna(axis=0, subset=['level','update_level']) # 删除'level'和'update_level'这两列中有缺失值的列