Probability Chart (Cumulative Frequency) 最好用的统计分布图形

我们常用的统计分布图形有直方图(Histogram),趋势图(Trend Chart),箱图(Box Plot),Probability Chart (Cumulative Frequency Chart)。这些图形都是用来显示数据的统计分布的,其中直方图是最简单的;趋势图主要是用来显示数据随着事件的变化;箱图是在另一个维度的分布,同时加入了置信区间等信息;最近接触了Probability Chart, 发现它是一个非常好用的统计分布图形,信息也非常丰富。下面我们来对比一下各自的优缺点,就可以发现为什么Probability Chart被认为是最好用的统计分布图形了。

我们先来看一下各种统计分布图形的样子并介绍一下对应的参数。

  1. 第一个是直方图,这个图非常常用,它可以很清楚地表示出数据在不同区间的出现的数量(概率);其中横轴是数据的区间,纵轴是每个区间内的数据样本出现的次数。这样就可以让我们很清楚地看到整个样本空间的分布状态,同时在图像还可以标注均值和上下限的信息。

  1. 第二个是趋势图,这个图形主要是把数据样本按照时间的顺序展示出来,这样如果数据样本与时间有相关性,在图上就可以一眼看出来。纵轴是数据区间,横轴是时间轴。当然也可以在图上标注均值和上下限信息。

  1. 箱图是另一个维度的统计分布,添加了一些额外的统计参数信息。其中纵轴是数据区间,横轴是分组条件,所以箱图在分组对比的时候是非常清晰的。中间矩形的上下边分别对应上下四分位数(Q3, Q1),盒子中间的一条实线是中位数。然后两端的横线对应的分别是Q3+1.5IQR和Q1-1.5IQR。在这两条线外的点都被认为是异常点。同时可以显示均值和上下限。

  1. Probability Chart (Cumulative Frequency) , 这是一个非常好用的统计分析图,信息也比较多。横轴是数据区间,纵轴是可能性 (0 ~ 1),这个可能性同时也代表百分比(这个非常有用)。图上也可以展示均值和上下限。

从下面的图形可以很清楚地看出所有样本中fail上限的数量的比率为0.02%。同样我们也可看fail下限的样本的比率。我们也可以看样本主要分布在哪个区间。

分组对比

统计分布的分组对比是非常常用的,但是不是所有图形都可以很清晰地分组对比的。其中趋势图是最不适合的,由于数据样本多的时候无法在图上区分,所以不建议用把分组数据绘制在同一个趋势图上。

     从下面的统计图形的分组对比中,我们可以看出直方图用来显示分组对比也不是很清楚,而最清楚的是箱图和Probability Chart.

 

 

 

 

 

大家应该已经可以看出来Probability Chart的优势了,最后在给大家看一下散点图(Scatter plot或者X-Y plot)。这个图是用来查看不同参数之间是否具有相关性的。

X轴是一个参数,Y轴是第二个参数

 

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值