pandas 缺失值异常值处理

最新推荐文章于 2023-07-13 15:29:40 发布

塞上江南o

最新推荐文章于 2023-07-13 15:29:40 发布

阅读量1.2k

点赞数

分类专栏： Pandas

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43192537/article/details/107324656

版权

Pandas 专栏收录该内容

20 篇文章 0 订阅

订阅专栏

目录

缺失值

缺失值的判定

在这里插入图片描述

pd.isnull（）

在这里插入图片描述

pd.notnull()

在这里插入图片描述

#### pd.notnull()
错误筛选

在这里插入图片描述

缺失值的处理

pd.dropna（）

在这里插入图片描述

在这里插入图片描述

pd.drop_duplicates()

df = pd.DataFrame({'color':['red','blue','red','red'],'price':[10,15,20,10]})
display(df)

在这里插入图片描述

如果使用df3 = pd.concat([df1,df2],axis = 1)生成新的DataFrame，新的df3中columns相同，使用drop_duplicates()会出问题

# 按color这一列， 清除重复数据
df.drop_duplicates('color')

在这里插入图片描述

pd.fillna()

t.mean()会求当前所有列为nan的平均值
在这里插入图片描述

在这里插入图片描述

异常值

异常值处理

处理标准：根据正太分布将过大或者过小的数据删除

即x - x_mean > 3σ该值异常值

σ：std标准差

x_mean：平均值

import pandas as pd
import numpy as np


df = pd.DataFrame(np.random.randn(100000,3),columns = ['red','green','blue'])
cond = df.abs() - df.mean() > 3*df.std()
cond.sum()  # 小于3σ标准的总和
# 让小于3σ标准的那些作为条件 即布尔索引
# 借助any()函数, 测试是否有True，有一个或以上返回True，反之返回False
cond = cond.any(axis = 1)
df2 = df.drop(labels=df[cond].index)

在这里插入图片描述

关注

0
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
pandas 缺失值异常值处理

目录pd.isnull（）pd.notnull()pd.dropna（）df.fillna()pd.isnull（）pd.notnull()pd.dropna（）df.fillna()
复制链接

扫一扫

专栏目录

塞上江南o CSDN认证博客专家 CSDN认证企业博客

码龄6年

476: 原创

3万+: 周排名

50万+: 总排名

64万+: 访问

: 等级

9491: 积分

238: 粉丝

541: 获赞

179: 评论

2139: 收藏

私信

关注

热门文章

分类专栏

最新评论

1.6-5求解旋转词问题
sunnyzmy: niuB
MongoDB CRUD
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接。
mysql 权限操作
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接；(3)增加除了各种控件外，文章正文的字数。
hive 生成拉链表&拉链表数据查询&拉链表回滚
CSDN-Ada助手: 如何在 Hive 中进行大数据的并行处理？
linux 系统黑洞简单使用案例
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加除了各种控件外，文章正文的字数；(3)使用更多的站内链接。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。