1. 检测
有如下dataframe,先用df.isnull().sum()
检查下哪一列有多少NaN:
import pandas as pd
df = pd.DataFrame({'a':[None,1,2,3],'b':[4,None,None,6],'c':[1,2,1,2],'d':[7,7,9,2]})
print (df)
print (df.isnull().sum())
输出:
2. 去除
将含有NaN的列(columns)去掉:
data_without_NaN =df.dropna(axis=1)
print (data_without_NaN)
输出:
3. 对于inf我们可以先将其替换成nan,或者在文件开头加入设置语句:
pd.set_option('mode.use_inf_as_na', True)