python缺失值有3种:
1)Python内置的None值。None,使用df['date'].isnull()进行判断是否为空值。
2)在pandas中,将缺失值表示为NA,表示不可用not available。
3)对于数值数据,pandas使用浮点值NaN(Not a Number)表示缺失数据。
所以,缺失值有3种:None,NA,NaN
pandas中的dataframe对象,删除缺失值的方式:
df.dropna(how='all')#删除所有内容均为缺失值的行
df.dropna(axis=1) #丢弃有缺失值的列
df.dropna(axis=1, how = 'all') #丢弃所有列中所有值均缺失的列
df.dropna(axis=0, subset=['name', 'age'])#丢弃name和age这两列中有缺失值的行