【参考资料】
1.Shape, Center, and Spread of a Distribution
1 Shape
顾名思义,数据分布的形状描述的就是其 PDF 的形状,具体类型大致有以下几种
显然,Shape of 高斯分布 = bell-shape (symmetric, unimodal)
2 Center
对于数据分布的中心,至少有四种最常见的衡量方式
- mean 均值
μ = Σ x N \mu=\frac{\Sigma x}{N} μ=NΣx and x ˉ = Σ x n \bar{x}=\frac{\Sigma x}{n} xˉ=nΣx - median 中位数
例如集合 {1, 2, 99, 1000, 200000} 的中位数为 99 - mode
most frequent data value 出现次数最多的数据 - midrange
midrange = (max + min) / 2
3 Spread
Spread 散布,能够描述概率分布的许多性质
- variance & standard deviation 方差和标准差
σ 2 = Σ ( x − μ ) 2 N \sigma^2 = \frac{\Sigma(x-\mu)^2}{N} σ