series
# 目标series
import numpy as np
ser = pd.Series(['a','b',np.nan,'c',''])
# 删除空值(空字符串不算空值!).inplace=True表示在原series上进行修改
ser.dropna(inplace=True)
结果:
Out[1]:
0 a
1 b
3 c
4
dtype: object
dataframe
# 目标df
df = pd.DataFrame({"name": ['A','B','C',np.nan],
"age": [np.nan,22,25,np.nan],
"gender": ['male','female','male','female'],
})
# 删除name、age列中,【任意一列】的值为空的行;
df.dropna(subset=['name', 'age'],
axis=0, # axis=0表示删除行;
how='any', # how=any表示若列name、age中,任意一个出现空值,就删掉该行
inplace=True # inplace=True表示在原df上进行修改;
)
# 删除name、age列中,二者都为空的行。
# 删除都为空的行,还是删除任意一列值为空的行,使用参数how来控制
df.dropna(subset=['name', 'age'],
axis=0,
how='all', # how='all'表示若指定列的值都为空,就删掉该行
inplace=True)
结果:
Out[1]:删除name、age列中,【任一列值为空】的行
name age gender
1 B 22.0 female
2 C 25.0 male
Out[2]:删除name、age列中,【二者都为空】的行
name age gender
0 A NaN male
1 B 22.0 female
2 C 25.0 male