nan来自于numpy中numpy.nan,字面意思应该是Not a Number。在不同代码中有nan,有NaN,有NAN,但其实他们都一样的
In [1]: import numpy as np
In [2]: np.nan is np.NaN is np.NAN
Out[2]: True
nan判断
None等于None,但是对于nan,nan并不等于nan
In [8]: None == None
Out[8]: True
In [4]: np.nan == np.nan
Out[4]: False
判断时可以用
In [3]: np.isnan(np.nan)
Out[3]: True
nan类型
看到nan容易想到None,但是输出nan的类型,发现nan为float类型:
In [5]: type(np.nan)
Out[5]: float
In [6]: type(None)
Out[6]: NoneType
遇到nan时的处理方法
加法,直接忽略掉:
In [7]: np.nansum([11,np.nan,123]) Out[7]: 134.0
统计array中nan个数(利用nan !=nan 为True):
In [9]: a = np.array([1,2,3,4,np.nan,5,np.nan,np.nan]) In [10]: a Out[10]: array([ 1., 2., 3., 4., nan, 5., nan, nan]) In [11]: np.count_nonzero(a != a) Out[11]: 3