1、pandas使用NaN表示缺失数据,也称为哨兵值
2、用isNull判断是否有缺失值
3、当对数据进行清洗分析时,最好对缺失数据进行分析,判断缺失值对整个数据的影响
4、Series中过滤空值:使用dropna过滤掉一个仅含非空数据和索引值的Series,下面两种写法是等价的
5、DataFrame中过滤空值:dropna默认丢掉任何含有缺失值的行,使用how = 'all'过滤掉全是空值的行
thresh空值观测数据量
6、对缺失值进行填补:可以使用fillna方法,可以以特定值填充
7、也可以对不同列填充不同的值