python异常值删除_python 异常值处理-替换为值

在处理数据用于建模的时候,遇到了长尾数据,需要处理异常值,于是参考网上的资料,重新写了函数。

是把一个DataFrame的某列超过预计范围(IQR方法)的数据重新赋值为上、下限的方法,如果要删除异常值,需要修改后面几个。

1 importpandas as pd2

3 def outliners(data,col,scale=3):4 defbox_plot_outliners(data_ser,box_scale):5 IQR=box_scale*(data_ser.quantile(0.75)-data_ser.quantile(0.25))6 val_low=data_ser.quantile(0.25)-IQR7 val_up=data_ser.quantile(0.75)+IQR8 rule_low=(data_serval_up)10 returnrule_low,rule_up,val_low,val_up11 data_n=data.copy()12 data_series=data_n[col]13 rule_low,rule_up,val_low,val_up=box_plot_outliners(data_series,box_scale=scale)14 data_n[col].loc[rule_up]=val_up15 data_n[col].loc[rule_low]=val_low16 return data_n

使用的时候,直接把一个df输入,指定一个列,就可以输出一个新的df

df_new=outliners(df,'the_col_name',scale=3)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
对于时间序列数据,常常会出现缺失值和异常值,这对数据分析和建模都会带来影响。下面分别介绍一下处理方法。 一、缺失值处理 1.删除缺失值 对于缺失值比较多的数据,可以考虑直接删除缺失值。Pandas库中的dropna()函数可以删除缺失值。 ```python import pandas as pd data = pd.read_csv("data.csv") data.dropna(inplace=True) # 删除缺失值 ``` 2.插值填充 如果数据中的缺失值比较少,可以考虑使用插值法填充缺失值。Pandas库中的interpolate()函数可以进行插值填充。 ```python import pandas as pd data = pd.read_csv("data.csv") data.interpolate(inplace=True) # 插值填充缺失值 ``` 3.向前填充和向后填充 对于时间序列数据,可以使用向前填充和向后填充来填充缺失值。Pandas库中的ffill()函数可以进行向前填充,bfill()函数可以进行向后填充。 ```python import pandas as pd data = pd.read_csv("data.csv") data.fillna(method="ffill", inplace=True) # 向前填充缺失值 data.fillna(method="bfill", inplace=True) # 向后填充缺失值 ``` 二、异常值处理 1.删除异常值 可以使用Pandas库中的quantile()函数来计算数据的分位数,并删除超出分位数范围数据。 ```python import pandas as pd data = pd.read_csv("data.csv") q1 = data.quantile(0.25) q3 = data.quantile(0.75) iqr = q3 - q1 data = data[(data > q1 - 1.5 * iqr) & (data < q3 + 1.5 * iqr)] ``` 2.替换异常值 可以使用Pandas库中的replace()函数来替换异常值。 ```python import pandas as pd data = pd.read_csv("data.csv") mean = data.mean() std = data.std() data[(data < mean - 3 * std) | (data > mean + 3 * std)] = mean ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值