对于数值数据,Pandas使用浮点值NaN(Not a Number)表示缺失数据。
在介绍Pandas缺失值的处理之前,首先创建一个不同地区商品退单量的数据集,代码如下:
import numpy as np
import pandas as pd
return = {'春季': [90,87,None,None,90,90],'夏季': [91,89,None,91,88,82],'秋季': [89,None,None,82,85,95],'冬季': [96,83,None,85,99,80]}
return = pd.DataFrame(return, index=['东北', '华东', '华中', '华南','西南','西北'])
运行上述代码,创建的数据集,如下所示。
return
春季 夏季 秋季 冬季
东北 90.0 91.0 89.0 96.0
华东 87.0 89.0 NaN 83.0
华中 NaN NaN NaN NaN
华南 NaN 91.0 82.0 85.0
西南 90.0 88.0 85.0 99.0
西北 90.0 82.0 95.0 80.0
用isnull()函数判断是否是缺失值,代码和输出如下所示。
return.isnull()
春季 夏季 秋季 冬季
东北 False False False False
华东 False False True False
华中 True True True True
华南 True False False False
西南 False False False False
西北 False False False False