python异常值替换为缺失值_删除异常值（+/-3std）并在Python/pandas中替换为np.nan

最新推荐文章于 2024-02-18 20:30:40 发布

weixin_39631467

最新推荐文章于 2024-02-18 20:30:40 发布

阅读量1.8k

点赞数

文章标签： python异常值替换为缺失值

我看到了几种接近解决我问题的方法

但是到目前为止他们还没有帮助我成功。

我相信下面的解决方案是我所需要的，但是仍然会出现一个错误(而且我没有声誉点来评论/质疑它)：link

(我得到以下错误，但不知道在管理以下命令时，.copy()或添加“inplace=True”的位置：

设置为复制警告：

试图在数据帧切片的副本上设置值。

试着用.loc[row_indexer,col_indexer] = value代替

请参阅文档中的注意事项：link

所以，我试着提出我自己的版本，但我一直被卡住。给你。

我有一个按时间编制索引的数据框架，其中包含站点的列(许多不同站点的字符串值)和浮点值。time_index site val

我想浏览按站点分组的“val”列，并将任何异常值(与平均值的正负3个标准差)替换为NaN(每组)。

当我使用以下函数时，我无法使用真/假向量索引数据帧：def replace_outliers_with_nan(df, stdvs):

dfnew=pd.DataFrame()

for i, col in enumerate(df.sites.unique()):

dftmp = pd.DataFrame(df[df.sites==col])

idx = [np.abs(dftmp-dftmp.mean())<=(stdvs*dftmp.std())] #boolean vector of T/F's

dftmp[idx==False]=np.nan #this is where the problem lies, I believe

dfnew[col] = dftmp

return dfnew

另外，我担心上面的函数在700多万行上会花费很长时间，这就是为什么我希望使用groupby函数选项。

weixin_39631467

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python异常值替换为缺失值_删除异常值（+/-3std）并在Python/pandas中替换为np.nan

我看到了几种接近解决我问题的方法但是到目前为止他们还没有帮助我成功。我相信下面的解决方案是我所需要的，但是仍然会出现一个错误(而且我没有声誉点来评论/质疑它)：link(我得到以下错误，但不知道在管理以下命令时，.copy()或添加“inplace=True”的位置：设置为复制警告：试图在数据帧切片的副本上设置值。试着用.loc[row_indexer,col_indexer] = value代替...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。