数据分析介绍之六——单变量数据观察之汇总统计和箱线图

你可能已经注意到,到目前为止我还没有在所有关于平均数和中位数、标准差等简单的主题发言,和百分位数。那是很有意的。这些汇总统计仅适用于某些假设,如果这些假设未实现,则是误导性的,如果不是完全错误的话。我知道这些量是容易理解和容易计算的,但是如果有一条信息我想让你从这本书中拿走的话,那就是:某物是方便和受欢迎的事实是没有理由跟风的。对于要使用的任何方法,请确保了解基本假设,并始终检查它们是否满足您所考虑的特定应用程序!

均值、中位数和相关汇总统计量仅适用于具有单峰分布的单峰分布的分布。如果这个基本假设没有实现,那么基于简单总结统计得出的结论将是错误的。更糟糕的是,没有什么能让你明白他们错了:这些数字看起来相当合理。(我们将看到这个问题的一个例子不久。)

一、汇总统计

如果一个分布只有一个单峰,那么问这个峰值的性质:它位于何处,它的宽度是什么意义?我们还想知道是否有任何异常的分布是对称的,存在。

均值和标准差的位置和传播两种流行的措施。平均或平均是既熟悉和直观的:
这里写图片描述

标准差测量了平均值与平均值之间的距离:我们计算每个点和平均值之间的所有差异,然后计算所有这些差异的平均值。因为数据点可以高于或低于平均和我们想要的不正、负偏差相互抵消,总结个人的偏差的平方和取平均平方偏差。(第二个方程在实践中非常有用,可以从第一个定义中找出均值之后)。

这里写图片描述

以这种方式计算的S2量称为方差࿰

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值