离群点的选择需要斟酌一下,这里选择的方法是extreme outlier。 First Quartile − 3 ∗ Interquartile Range First Quartile + 3 ∗ Interquartile Range 原始数据是这样的: 剔除离群点: first_quartile = data['A'].describe()['25%'] third_quartile = data['A'