from pandas import Series import pandas as pd import numpy as np #np.random.seed(12345) data=pd.DataFrame(np.random.randn(1000,4)) #print(data.describe()) print(data[(np.abs(data)>3).any(1)])#超过3或者-3的行 #print(data[(data.abs()>3).any(1)])#超过3或者-3的行 data[np.abs(data)>3]=np.sign(data)*3#np.sign返回一个由1和-1组成的数组,表示原始值的符号 print(data.describe())
检测和过滤异常值
最新推荐文章于 2022-05-24 15:38:15 发布