数据预处理:处理缺失值

本文详细介绍了Python数据分析中处理缺失值的方法,包括使用isnull()判断缺失值,dropna()过滤缺失值,以及fillna()填充缺失值的各种策略,如常数填充、字典映射填充、前后向填充等。
摘要由CSDN通过智能技术生成

前言

本文参照《利用Python进行数据分析》一书,介绍了对Series和DataFrame对象进行缺失值处理的一些方法

缺失值处理

1. isnull方法

isnull方法用于判断哪些值为缺失值(NaN),并返回布尔值
举例如下:

import pandas as pd
from numpy import nan as NA
data = pd.DataFrame([[1., 6.5, 3.], [1., NA, NA],
                     [NA, None, NA], [NA, 6.5, 3.]])
print(data)
print(data.isnull())

输出依次为:

# data
     0    1    2
0  1.0  6.5  3.0
1  1.0  NaN  NaN
2  NaN  NaN  NaN
3  NaN  6.5  3.0
# data.isnull()
       0      1      2
0  False  False  False
1  False   True   True
2   True   True   True
3   True  False  False

值得一提的是,python内建的None值也被当做NaN处理(见data[2][1])

isnull方法并不改变原对象,不信可以试着再输出data试试?

另有一个notnull方法,用法与isnull相似,作用与其相反

2.dropna方法

  • dropna方法用于过滤缺失值,默认会删除包含缺失值的
  • 同样的,该方法也不改变原对象

举例如下:

import pandas as pd
from numpy import nan as NA
data = pd.DataFrame([[1., 6.5, 3.], [1., NA, NA],
                     [NA, None, NA], [NA, 6.5, 3
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值