从 统计学 学习笔记 (四)—— 掌握数据的整体状态 直方图 中的直方图反映出了一个可能性:既然一组数据的分布可以被表示为一条曲线,而且从这条曲线出发,可以得到上面所说的大部分指标,那么,这条曲线是否可以用数学的形式表示出来呢?
初中数学告诉我们,曲线可以表示为一个数学公式。只不过不一样的曲线,对应的公式不同。有了这个公式,我们就可以用“一个说法”来表示一组数据到底是怎么个整体情况。相比较直方图而言,用公式可以进行精确的计算,得到精确的结果。在概率论中,这个公式也被称为概率密度函数(probability density function),对应的曲线就叫做“分布曲线”。
从[List ofprobability distributions, http://en.wikipedia.org/wiki/List_of_probability_distributions]可以看到,数据分布千姿百态,如果是统计专业的学生,估计会研究一下。但这个系列的文章关注的还是如何应用统计学的方法解决实际问题,因此就选几个在医学统计学领域比较常用的分布进行介绍了。
正态分布
在所有的分布中,正态分布(高斯分布,normal distribution, Gaussian distribution)几乎是家喻户晓。这不是没有理由的。自然界和人