参考资料:Python中Nan||None||NaT||Null
背景:
python中有许多表示空值的方式,本文对不同的空值表达方式从类型、等值性、语法方面进行归纳总结
1. None
介绍
None是python中独有的特殊数据类型,它不同于空列表、空字符串、空Series等,它是一个特殊的存在,表示什么都没有。
类型
NoneType
2. NaN和np.nan
介绍
NaN(not a number)是属于numpy和pandas下的专有数据类型,不是python原生的。np.nan在import numpy as np
后可以使用,而NaN需要额外from numpy import NaN
类型
float
语法
由于np.nan和NaN的等值性比较特殊,NaN == NaN会return false,所以判断一个值是否为空需要调用pandas活着numpy包中的api,具体语法如下:
对于整体的Series或者Dataframe判断是否为空:isnull()
对于单独的某个值判断:np.isnan()
3. Null
介绍
NULL是C语言中表示空值的主要表现方式,而Python中没有Null,在python中的等位替换为None
4. NaT
介绍
NaT是numpy和pandas中一种特殊的空值,类似于NaN中var = np.nan的方式对变量赋NaT,该变量只会出现在python连接数据库读取数据的情况下(未找到相关官方资料,如有不对之处请指正),如果数据库中的数据类型是timestamp等与时间相关的类型,而其中又没有数据的话,用python读取后可能为此类型。
类型
datetime非时间标量值
语法
判断是否为空的语句(对单个值而不是dataframe):np.isnat()
注意:对NaT执行x.tz_localize(None)
等时区转换的操作不会报错。
5. 等值性
在python中等值性不太稳定,总体来说None的表现比NaN稳定,推荐优先考虑None或者空字符串。