这一期咱们继续讲讲一些基本的数据操作。不管是从数据源读取的数据,还是自己造的数据,都可能有部分字段部分行缺失。在数据分析过程中,缺失值的处理是一个很重要的操作。Python的DataFrame对于缺失值显示的是NaN。
首先,咱们还是利用上次造的数据。
import pandas as pd
dic={
'math':[88,66,55],
'physics':[99,77,33],
'science':[55,88,65]
}
df=pd.DataFrame(data=dic,index=['student1','student2','student3'])
1、空值判断
isnull():是否是空值
notnull():是否不是空值
使用df.isnull()语句会返回数据表中每个字段是否空值的布尔(true/false)判断。
除此之外,我们也可以用df1.notnull().all(axis=1)判断哪一行有空值。
2、空值的删除与填充
dropna(): 删除丢失数据
fillna(): 填充丢失数据
使用df1.dropna()语句删除任意含有空值的行,如果想要删除