怎样用excel剔除异常数据_如何剔除异常数据?

筛选异常值的方法有z-scores, modified z-score, box plots, Grubb’s test,Tietjen-Moore测试指数平滑法,Kimber测试指数分布和移动窗口滤波算法。然而比较详细的两个方法是:

Inter Quartile Range

An outlier is a point of data that lies over 1.5 IQRs below the first quartile (Q1) or above third quartile (Q3) in a given data set.

High = (Q3) + 1.5 IQR

Low = (Q1) – 1.5 IQR

Tukey Method

It uses interquartile range to filter very large or very small numbers. It is practically the same method as above except that it uses the concept of “fences”. The two values of fences are:

Low outliers = Q1 – 1.5(Q3 – Q1) = Q1 – 1.5(IQR)

High outliers = Q3 + 1.5(Q3 – Q1) = Q3 + 1.5(IQR)

在这个区域外的任何值都是异常值

当你发现异常值时,你不应该不对它进行一个定性评估就删除它,因为这样你改变了数据,使其不再纯粹。重要的是要在理解分析的背景下或者说重要的是“为什么的问题——为什么异常值不同于其他数据点?”

这个原因是至关重要的。如果归因于异常值错误,你可能把它排除,但如果他们意味着一种新趋势、模式或显示一个有价值的深度数据,你应该保留它。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1. 导入Excel数据 首先,在Excel中打开要导入的数据文件。然后,选择“数据”选项卡,点击“从文本”按钮。接着,选择要导入的数据文件,然后点击“导入”按钮。 在“文本导入向导”窗口中,选择“分隔符”选项,然后选择您的数据文件中使用的分隔符。如果您的数据文件使用逗号分隔符,则选择“逗号”选项。如果您的数据文件使用制表符分隔符,则选择“制表符”选项。 接下来,选择“下一步”按钮,然后选择要导入的数据类型。如果您的数据文件包含数字和文本,则选择“常规”选项。如果您的数据文件只包含数字,则选择“数值”选项。 最后,选择“完成”按钮,然后选择要将数据导入到的Excel工作表。点击“确定”按钮,然后Excel将自动将数据导入到工作表中。 2. 异常数据剔除Excel中,您可以使用筛选器来剔除异常数据。使用筛选器可以帮助您快速找到和剔除不需要的数据。 首先,选择您要筛选的数据列。然后,选择“数据”选项卡,点击“筛选器”按钮。接着,选择要筛选的数据列,然后选择“筛选器”选项。 在筛选器窗口中,您可以使用不同的条件来筛选数据。例如,您可以使用“大于”或“小于”条件来筛选数据。您还可以使用“等于”或“不等于”条件来筛选数据。 最后,选择要剔除数据,然后点击“删除行”按钮。Excel将自动删除选定的行。 3. 可视化数据Excel中,您可以使用图表来可视化数据。图表可以帮助您更好地理解数据,发现数据中的趋势和模式。 首先,选择要可视化的数据列。然后,选择“插入”选项卡,点击“图表”按钮。接着,选择要使用的图表类型,例如柱状图或折线图。 在图表编辑器窗口中,您可以自定义图表的外观和样式。例如,您可以更改图表的标题和标签。您还可以更改图表的颜色和样式,以使其更易于阅读和理解。 最后,选择“确定”按钮,Excel将自动为您生成图表。您可以将图表导出为图像文件,以便与其他人共享。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值