在实践的时候发现,常用的notnull函数并不能将空格识别为空值,但很多时候表格中的空数值是有空格存在的,这样单纯使用notnull就不能满足识别空的需求,经查阅资料,可利用Series的apply方法结合isspace()函数进行判断,修改空格为NaN,这样接下来继续用isnull()或notnull()就可以正常识别出所有的空数值了。
df['列名']=df['列名'].apply(lambda x: np.NaN if str(x).isspace() else x)
idx_null = df['列名'].isnull().sum(axis=0)
print(idx_null) # 统计空的个数
df[df['列名'].isnull()].to_excel("null.xlsx")#空的表
df[df['列名'].notnull()].to_excel("notnull.xlsx")#非空的表