当您需要确定特定某总体特征(例如均值)的信息时,通常从总体中取一些随机样本,因为对总体进行度量是不可行的。通过使用该样本,您可以计算对应样本的特征,其用于概括关于未知总体特征的信息。所需的总体特征称为参数,相应样本特征为样本统计量或参数估计值。由于统计量是对从样本获取的参数的信息的摘要,因此统计量值取决于从总体中取的特定样本。其值随机地从一个随机样本更换到下一个随机样本,因此统计量是一个随机量(变量)。此随机变量的概率分布称为取样分布。(样本)统计量的采样分布很重要,因为它使我们能够基于随机抽样得出关于相应总体参数的结论。
例如,当我们从一个正态分布总体中取随机样本时,样本均值就是一个统计量。基于样本的样本均值是对总体均值的估计。如果从该同一正态总体中取不同的样本,该估计值将随机变化。用于描述这些变化的概率分布是样本均值的抽样分布。统计量的采样分布指定了统计量的所有可能值,以及统计量值的极差的变化频率。如果总体为正态,则样本均值的采样分布也为正态。
以下各节提供有关参数、参数估计值和采样分布的详细信息。
关于参数
参数是整个总体的描述性度量,它可用作概率分布函数 (PDF) 的输入以生成分布曲线。参数通常用希腊字母表示,以与样本统计量区别开来。例如,总体均值由希腊字母 mu (μ) 表示,总体标准差由希腊字母 sigma (σ) 表示。参数是固定常量,也就是说,它们不会像变量一样变化。不过,它们的值通常是未知的,因为对整个总体进行度量是不可行的。
每个分布完全由若干个特定参数来定义,参数的个数通常为一到三个。下表提供了三种分布所需参数的示例。参数值决定了分布图上的曲线的位置和形状,参数值的每个唯一组合可产生唯一的分布曲线。分布参数 1参数 2参数 3卡方自由度 正态均值标准