numpy中np.nan(pandas中NAN)

最新推荐文章于 2025-04-01 18:00:52 发布

晓东邪

最新推荐文章于 2025-04-01 18:00:52 发布

阅读量7.5w

点赞数 28

分类专栏： numpy pandas 采坑记录文章标签： numpy nan pandas notnull isnan

本文链接：https://blog.csdn.net/xiaodongxiexie/article/details/54352889

版权

pandas 同时被 3 个专栏收录

20 篇文章

订阅专栏

采坑记录

19 篇文章

订阅专栏

numpy

13 篇文章

订阅专栏

本文介绍了在Python中如何正确地检测浮点数NaN（Not a Number）值。由于直接比较两个NaN值将返回False，因此文章提供了几种有效的方法，包括使用NumPy的isnan函数、Pandas的isnull函数以及Python内置math库的isnan函数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在处理数据时遇到NAN值的几率还是比较大的，有的时候需要对数据值是否为nan值做判断，但是如下处理时会出现一个很诡异的结果：

import numpy as np

np.nan == np.nan
#此时会输出为False

对np.nan进行help查看，输出如下：

Help on float object:

class float(object)
 |  float(x) -> floating point number
 |  
 |  Convert a string or number to a floating point number, if possible.
 。。。
 |

可以得到其属于float的子类，发现有个方法可以这么用：

np.isnan(np.nan)
#这样就可以检测np.nan值了

或者可以用pandas库来检验：

import pandas as pd
pd.isnull(np.nan)
#此时一样输出为True
#同样的pd.notnull()用来判断不为nan值

还可以用python内置math来查看：

In [13]: import math

In [14]: import numpy as np

In [15]: n = np.nan

In [16]: math.isnan(np.nan)
Out[16]: True

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

晓东邪

关注关注

28
点赞
踩
74

收藏

觉得还不错? 一键收藏
12
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

【python Numpy】处理np.nan类型的缺失值

m0_62599305的博客

02-11

508

（Not a Number）值的处理方式，可以帮助我们高效地进行数据清洗和缺失值处理。可以按行或列进行缺失值替换或删除。和其他函数，我们可以有效地检测、替换和删除缺失值。如果我们不想替换缺失值，而是希望删除这些值所在的元素，NumPy 提供了简单的删除方法。在数据处理中，缺失值的存在是一个常见问题。处理缺失值是数据分析和机器学习中的重要任务。如果我们想用数组的均值来填充缺失值，可以首先计算均值，再用。类型的缺失值，包括检测、替换和删除缺失值等常见操作。在处理缺失值时，通常我们希望用一个具体的值来替代。

将numpy二维数组中的np.nan值替换为指定的值

matlab2007的博客

10-28

8338

基础知识：（1）np.nan表示该值不是一个数，比如数据中收入、年龄的缺失值；np.inf表示无穷大（2）np.nan == np.nan 的结果为False （3）nan与任何数的操作结果均为nan,例如sum((np.nan,4)) 的结果为nan （4）一个ndarray数组t1，可以用np.isnan(t1) 定位到nan值的位置，再用t1[np.isnan(t1)] = 指定值将n...

12 条评论您还未登录，请先登录后发表或查看评论

Python Numpy:找到list中的np.nan值方法

12-25

这个问题源于在训练机器学习的一个模型时，使用训练数据时提示prepare的数据中存在np.nan 报错信息如下： ValueError: np.nan is an invalid document, expected byte or unicode string. 刚开始不知道为什么会有这个，后来发现是list中存在nan值下面是找到nan值的方法：简单找到： import numpy as np x = np.array([2,3,np.nan,5, np.nan,5,2,3]) for item in x: if np.isnan(item): print('yes'

使用numpy时对nan的处理

热门推荐

lei_chen的博客

12-11

2万+

nan(NAN，Nan):not a number 表示不是一个数字，np.nan是一个float类型的数据什么时候numpy中出现nan，当我们读取本地文件为float时，如果有缺失，或者做了不合适的计算，比如无穷大(inf)减去无穷大。 inf表示正无穷，-inf表示负无穷，当一个数字除以0时，python会报错 np.nan !=np.nan 因为nan不是一个数，所以相...

math、numpy、pandas 的 NaN

方小汪的博客

01-30

295

参考math、numpy、pandas 的 NaN 一、基本操作 #coding=utf8 import numpy as np import math print(type(np.nan))#<class 'float'> print(type(math.nan))#<class 'float'> print(np.nan is None)#False prin...

Python 关于np.nan和None的区别和导入数据库的注意事项

Hello world!

06-07

3555

工作中遇到这样的场景：把数据从生产环境以csv导出来后，要手工导入测试环境的mysql数据库。直接在mysql里导数的话，如果数据量大会非常慢，而且不稳定。写一个python脚本自动导数是最方便的，但要满足几个需求： 1.csv格式导出来的数据，数据库里如果是空值会变成N。但在mysql里我希望它还是空值null； 2.导入mysql的数据，希望能保留两位小数。 1和2要结合起来看，其实就是替换'N‘的同时做一些数据处理，需要注意的是python里数据类型的问题。思路是：1.先把N变为np.n

pandas处理丢失数据 None与np.nan

weixin_42424451的博客

07-09

3667

pandas处理丢失数据 None与np.nan 有两种丢失数据： None np.nan(NaN) import numpy as np import pandas as pd from pandas import Series,DataFrame df = pd.read_excel(‘students.xlsx’) df -----------------------------...

日常bug :关于np.NaN

二郎银的博客

12-15

379

np.NaN不是None，是float类型，千万注意。 type(np.NaN) Out[936]: float 另外，np.NaN都不是确定的数，所以nan之间有不同，比如： np.NaN==np.NaN Out[937]: False 所以是不能这样测试na的。但是np.inf 也是浮点型，np.inf是一样的,比如： type(np.inf) Out[939]: float np.inf==np.inf Out[938]: True ...

np.nan np.NAN np.NaN

xiangduixuexi的博客

08-30

1157

np.nan np.NAN np.NaN 这三个都是numpy库中的非数字类的表示方法。本质上这三个是一样的，但是很多人发现用==测试他们不相等，但实际应该用is进行等价测试。 import numpy as np print(np.nan == np.NaN) print(np.nan is np.NaN) 输出： ...

math、numpy、pandas NaN 判断

weixin_30551947的博客

05-21

454

>> np.nan == np.nan False >> np.nan is np.nan True >> math.nan is np.nan False >> np.isnan(math.nan) True 1. 判断 ndarray 中是否存在 nan >> c = np.array([ 1...

pandas缺失值np.nan, np.isnan, None, pd.isnull, pd.isna

Oona_01的博客

05-12

169

对某个值是否为nan进行判断，只能用np.isnan(i)，绝不可用 i == np.nan 来判断，因为nan具有不等于自身的属性，应该使用np.isnan来测试nan值，如np.isnan(np.nan)将产生True；numpy中的 isnan 对应的是 NaN 值，代表“不是数字”，数值类型为 float ，数组中显示为nan，能参与运算，但结果显示为NaN；到此这篇关于pandas缺失值np.nan, np.isnan, None, pd.isnull, pd.isna的文章就介绍到这了,

[Python]numpy中的nan和常用方法

m0_51955470的博客

04-07

352

【代码】[Python]numpy中的nan和常用方法。

关于numpy和pandas中关于nan的几个总结

rusi__的博客

11-16

1386

摘要仅个人总结，不保证绝对正确，仅服务个人。本意是纪录文章最后的黑体字部分。正文在计算平均值等类似操作的时候numpy中的nan会参与计算，而pandas的nan不会。 np中的nan是float类型，所以在进行相关操作的时候需要将别的数据类型（int->float）进行转换，但是pandas中你不用考虑这个问题。对比下面两片将nan替换为均值的代码就可以知道两者在处理na...

python之pandas中NaN与None的比较与处理

hutaotaotao的博客

05-08

4749

python之pandas中NaN与None的比较与处理

np.nan与NAN

04-01

### 关于 `numpy.nan` 和 `NAN` 的区别及使用场景 #### 定义与本质在 Python 中，`numpy.nan` 是 NumPy 库定义的一个特殊浮点数常量，表示 IEEE 浮点标准中的“Not a Number” (NaN)[^1]。它本质上是一个浮点数值，在底层实现上遵循 IEEE 754 标准。而 `NAN` 并不是一个特定的关键字或者内置对象；通常情况下，它是作为变量名或其他上下文中使用的缩写形式存在。如果提到大写的 `NAN` 而不是小写的 `nan`，可能是开发者自定义的命名方式或者是某些库中的一种约定表达[^2]。因此严格来说，“`numpy.nan` vs `NAN`”更应该被理解为讨论的是 NumPy 提供的标准 NaN 常量与其他可能存在的非标准化表示之间的对比。 #### 表现行为上的差异当涉及到具体操作时，比如逻辑运算、算术计算以及数组比较等方面： - **相等性检测** - 使用普通的等于 (`==`) 运算符无法正确判定两个 NaN 是否相同，因为按照 IEEE 规范规定任何 NaN 都不等于另一个 NaN（甚至也不等于其自身）。所以对于 Pandas Series 或者 Numpy 数组而言，推荐采用 `.equals()` 方法或者其他专用工具来进行一致性评估而不是简单依赖双等号测试。 - **缺失值标记作用** - 在数据分析领域内，无论是来自纯 Python 的 `None` 类型还是由科学计算框架引入的 `numpy.nan` ，都可以充当指示单元格为空白状态的角色。不过需要注意前者属于可变长度的对象指针结构因而占用更多内存空间同时也难以参与向量化加速过程；后者则刚好相反——固定大小且能很好地融入到高性能线性代数算法当中去。 - **转换关系** - 当准备把含有空洞的数据集迁移到外部存储介质如 SQL 数据库表里头的时候，则有必要先把所有的 float-type NaN 替换回 None 形式的 null placeholder 来适应目标系统的语法规矩。 #### 示例代码展示如何区分并处理这两种情况下面给出一段简单的例子演示上述要点的实际应用效果: ```python import numpy as np import pandas as pd # 创建包含不同类型缺失值得序列 data = [1, None, np.nan] # 查看原始列表内容及其 dtype 属性变化后的样子 print(pd.Series(data)) """ 0 1.0 1 NaN # Note that 'None' has been converted to 'NaN' 2 NaN dtype: float64 """ # 尝试通过常规手段查找是否存在 NA-like entries na_mask = pd.isna(data) print(na_mask) """ [False, True, True] """ # 错误示范：试图直接利用 == 判断是否为 NaN comparison_result = data[-1] == np.nan print(comparison_result) # False -> This is expected according to the definition of NaN! correct_checking_method = np.isnan(data[-1]) print(correct_checking_method) # True -> Correct way to check if something really IS-a-NaN. ``` #### 总结建议为了获得最佳性能表现并且减少潜在错误风险，在从事涉及大量数值型数据的操作任务期间应当优先选用 NumPy 扩展包所提供的专业化解决方案即 `numpy.nan`. 同样重要的一点在于始终牢记关于 NaN 特殊性质的知识点从而合理规避掉那些容易引发困惑的地方.