Python笔记：Pandas的isna() vs isnull() vs numpy.isnan()有什么区别？

最新推荐文章于 2025-03-19 19:30:18 发布

htuhxf

最新推荐文章于 2025-03-19 19:30:18 发布

阅读量2.7w

点赞数 29

分类专栏： Python 笔记文章标签： isna isnull isnan 区别 python

原文链接：https://datascience.stackexchange.com/questions/37878/difference-between-isna-and-isnull-in-pandas

版权

Python 笔记专栏收录该内容

23 篇文章

订阅专栏

2020.12补充：目前 np.nan和''不再相等，举栗子：

import pandas as pd
import numpy as np

df = pd.DataFrame({'tem': ['a', 'b', 'c', ''],
                   'tem1': ['a', np.nan, '', 'd'],
                   'tem2': ['a', 'b', 'c', 'd']})

df['new'] = df['tem'] + df['tem1'] + df['tem2']
print(df)
# 结果如下
  tem tem1 tem2  new
0   a    a    a  aaa
1   b  NaN    b  NaN  # 注意：列new这里直接是NaN
2   c         c   cc
3        d    d   dd 

print(df[df['tem1'].isna()])
# 结果如下
  tem tem1 tem2  new
1   b  NaN    b  NaN    # 注意：结果仅有 NaN的

print(df[df['tem1']==''])
# 结果如下
  tem tem1 tem2 new
2   c         c  cc   # 注意：结果无 NaN的

附注：线下csv文件，空格在DataFrame里边也是用的“NaN”表示。

Pandas `isna()` vs `isnull()`

我觉得咱要说的是pandas.DataFrame.isna() vs pandas.DataFrame.isnull()。而不是pandas.isnull()，因为它不是用于DataFrame的。
这俩函数的功用一模一样！它俩甚至连官方文档都一模一样。你点击pandas的官网文档就明白了。

但是为什么搞2个函数、取2个名字，来做同样的事儿？

这是因为pandas的DataFrame是基于R的DataFrame。在R里边na和null是分开的2个东西。更多相关信息请参考这篇文章。

然而，在python里边，pandas是建在numpy上的（即numpy的定制版），而numpy可是没na，也没null，只有NaN的（是 “Not a Number”的缩写）。因此，pandas还用NaN。

简单说呢就是：

numpy里边查找NaN值的话，就用np.isnan()。
pandas里边查找NaN值的话，要么.isna()，要么.isnull()。
NaN源于这样一个事实：即pandas构建在numpy之上，而这两个函数的名称源自R的DataFrame，pandas就是试图模仿它的结构和功能。

博客等级

码龄7年

39
原创

875
点赞

3760
收藏

228
粉丝

关注

私信

分类专栏

展开全部收起

最新评论

Python：入门 - 数据预处理 - 正则表达式之通配符
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)提升标题与正文的相关性。
调参简例：SARIMA模型_手工调参过程
小白在呐喊: 这个函数参数没对应上，n_test和cfg_list搞反了
python笔记：df.plot()常见的坐标轴的操作，及正常显示负号
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)提升标题与正文的相关性。
python 可视化：subplots的title和tick labels和tick操作案例要点
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)增加除了各种控件外，文章正文的字数；(3)提升标题与正文的相关性。
sklearn笔记：StratifiedKFold和StratifiedShuffleSplit的区别？
TravelLight92: 有个很奇怪的地方，比如做一个信用卡欺诈的数据问题，样本比例非常不平衡，用两种划分方式对比：train_test_split(shuffle=1,test_size=0.2,seed=1,str=y)得到一组score，用StratifiedKfold(test_size=0.2,seed=1,n_split=5)得到5组score； precision还好说，五组里面有超过一次划分的，虽然总体均值还是低于一次划分，还能接受！但召回，train_test_split比较高，StratifiedKfold的五组比train_test_split都要低，甚至有点情况下，5组里面没有一个高于train_test_split的，所以我怀疑这StratifiedKfold，但是查证，StratifiedKfold的确只在划分前洗一次牌，所有数据都会用到，就很离谱！

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。