【Python数据可视化】02 第四章 数据清洗

Python 数据清洗

数据清洗的目的在于提升数据质量
Pandas 中常见的数据清洗 对空值和缺失值的处理 重复值的处理 异常值的处理

空值和缺失值

  • 空值一般表示数据未知 不适用或在以后添加数据
  • 缺少值是数据集中某个或某些属性的值不完整的

在 Pandas 提供了一些用于检查或处理空值和缺失值的函数 ,
其中
isnull( )notnull ( ) 函数就可以判断是否存在空值和缺失值。
对于缺失的数据 可以使用 dropna( )fillna( ) 方法进行删除和填充
在这里插入图片描述

from pandas import DataFrame ,Series
import pandas as pd
from numpy import NAN
series_obj = Series([1,None,NAN])
pd.isnull(series_obj) #检查 是否为空值或缺失值

这个代码的意思是 ,创建了一个Series 对象,对象中包含了 1 . None NAN 三个值
然后调用isnull()函数检查
第一个是正常的 ,后面两个缺失了

notnull( )函数

顾名思义 同理
在这里插入图片描述

dropna()方法

dropna 删除含有空值或缺失值行列

有关于 他的语法

在这里插入图片描述
他有四个参数
前两个参数 是看是否删除行列
后两个参数 看过滤的标准

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

-ATAO----

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值