07-20 缺失值处理二+ 异常值处理

本文探讨了在数据分析中如何处理缺失值,包括删除法和填补法,如使用均值、中位数、众数以及前后填补法。同时,介绍了异常值的判断标准,如均值标准差和分位数法,并提出了异常值的小处理方法,如替换和分位数替换法。
摘要由CSDN通过智能技术生成

缺失值处理二

一: 删除法

对于缺失值,一般不会直接进行删除,因为删除过多影响数据分析,所以会对其进行第二中操作,补齐

二: 填补法( 一般适用于 元素 为 float 或者 int的数据)

1. 均值或 中位数 补齐法:

df.age   ---查看age列

df.age.mean() ----查看年龄列平均值

df.age.fillna( df.age.mean() ) ----使用均值填补,即在缺失值位置 补上均值

df.age.median() _中位数的查看

df.age.fillna( df.age.median () )

2、众数填补法(适用于 字符型 数据)

df.gender ---- 查看性别
df.gender.fillna( df.gender.mode() )  ----查看性别列 -gender的众数

 众数一般不止一个,通常选择第一个)

df.gender.fillna( df.gender.mode()[0]) ---使用第一个众数填补 缺失值
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值