数据的形状及分布,讲了几种数据的样子,比如正态分布,偏态分布
正态分布,中位数众数均值均在中间,意味着数据是对称的,标准差控制着正态分布的胖瘦,因为标准差代表了数据距离均值的平均距离大小,概率也是固定的,均值上下一个标准差概率是68%,余下省略。
正态分布偏态分布都是只有一个峰值,有时候有些有多个峰值称为
多模数据
这是两个峰值,但你不清楚的是,是一个因素发生了两次,还是两个因素组合,都只发生了一次结合起来,总体看上去是发生了两次峰值,如图,第一个峰值是马拉松专业运动员过线的峰值,第二次峰值是业余的过线的峰值
平均分布
平均分布的形状基本上是一条直线,发生每种情况的概率相等,比如骰子的六个面,硬币的两个面等