判断nan的方法

最新推荐文章于 2024-05-27 15:37:49 发布

jpbirdy

最新推荐文章于 2024-05-27 15:37:49 发布

阅读量5.9w

点赞数 22

分类专栏：算法文章标签： python nan

本文链接：https://blog.csdn.net/jpbirdy/article/details/52333301

版权

算法专栏收录该内容

17 篇文章 0 订阅

订阅专栏

python在数据预处理的时候，经常遇到需要对空值进行处理的地方。

空值在python中的表现一般为：

1、None

2、False

3、''

4、nan

前3个很容易判断，直接=就可以了，第四种比较蛋疼，因为你会发现，它无法用==进行判断（这个跟nan的原因有关），这里要从nan的是啥说起。

NaN（not a number），在数学表示上表示一个无法表示的数，这里一般还会有另一个表述inf，inf和nan的不同在于，inf是一个超过浮点表示范围的浮点数（其本质仍然是一个数，只是他无穷大，因此无法用浮点数表示，比如1/0），而nan则一般表示一个非浮点数（比如无理数）

在数学上inf==inf，且inf == inf+X（X为任意浮点数），而nan != nan，因此在python中判断一个数是否是nan，可以直接判断他是否与自身相等

>>> np.nan == np.nan
False

这也是变量≠自身的一个特例，因此使用这个性质可以判断这个数是否为nan

nan的类型，如果硬要归类的话，应该更像浮点型

>>> np.nan
nan
>>> type(np.nan)
<type 'float'>

要注意的是，nan的类型是float，当对nan进行强制类型转换时，转换为整数型时会报错，一般的报错是如下情况：

>>> int(np.nan)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ValueError: cannot convert float NaN to integer
>>> long(np.nan)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ValueError: cannot convert float NaN to integer
>>> int('nan')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ValueError: invalid literal for int() with base 10: 'nan'

如果是报上面的错前两个错，则是因为被转型的已经是一个float的nan（np.nan），如果是报第三个错，则被转换的是字符串'nan'

而将nan或'nan'从字符串到float转换时，都不会出现错误。这也是有时候会隐藏的错误，因为numpy的ndarray是支持复合类型的（如object），如果是一个非法字符被先后转换为float，string，则会表现出是一个string，如果进行强转，则报第三个错。而且此时不能用x!=x判断。

现在python的大部分普通运算中已经不会出现nan，但是在numpy包中，从list转换nparray时，如果遇到类型不匹配，或其他问题导致转换失败时，仍然会以nan填充，而不是报错。在处理这类问题，则需要设置一些缺失值处理方法，这里pandas包里提供了很多，最常用的就是用空值或0替换掉。

jpbirdy

关注

22
点赞
踩
44

收藏

觉得还不错? 一键收藏
9
评论
判断nan的方法

python在数据预处理的时候，经常遇到需要对空值进行处理的地方。空值在python中的表现一般为：1、None2、False3、''4、nan前3个很容易判断，直接=就可以了，第四种比较蛋疼，因为你会发现，它无法用==进行判断（这个跟nan的原因有关），这里要从nan的是啥说起。NaN（not a number），在数学表示上表示一个无法表示的数，这里一般还会有另一个
复制链接

扫一扫