文章目录
推断统计学:通过从总体中抽取样本构造适当的统计量,由样本性质去推断关于总体的性质。
统计量
概念
统计量是样本的函数,不依赖于任何未知参数。
样本均值、样本方差是统计量,总体的均值和方差不是统计量,因为后者依赖于总体分布的未知参数。
由样本构造具体的统计量,实际上是对样本所含的总体信息按照某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上。不同的统计推断问题要求构造不同的统计量。
统计量 之于 统计学
随机变量 之于 概率论
变量 之于 微积分
常用统计量
- 样本的均值 X ˉ = 1 n ∑ i = 1 n X i \bar X=\frac{1}{n}\sum_{i=1}^nX_i Xˉ=n1∑i=1nXi,反映总体 X X X数学期望的信息。
- 样本方差 S 2 = 1 n − 1 ∑ i = 1 n ( X i − X ˉ ) 2 S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\bar X)^2 S2=n−11∑i=1n(Xi−Xˉ)2,反映总体 X X X方差的信息。另有:样本标准差。
分母为 n n n时就是样本的方差,不具备推断意义,因为一定小于总体的方差。
分母为 n − 1 n-1 n−1时就反映了总体的方差信息。
- 样本变异系数 V = S / X ˉ V=S/\bar X V=S/Xˉ,反映总体变异系数C的信息。
变异系数定义为 C = D ( X ) / E ( X ) C=\sqrt {D(X)}/E(X) C=D(X)/E(X),标准差与均值做比,也称离散系数coefficient of variation,是离散程度的度量。用于比较均值不同时不同总体的离散程度。
例如:投资项目风险分析,不同行业或群体的收入差距描述
- 样本 k k k阶矩 m k = 1 n ∑ i = 1 n X i k m_k=\frac{1}{n}\sum_{i=1}^{n}X_i^k mk=n1∑i=1nXik,其中 m 1 = X ˉ m_1=\bar X m1=Xˉ就是样本均值。
- 样本 k k k阶中心矩 v k = 1 n − 1 ∑ i = 1 n ( X i − X ˉ ) k v_k=\frac{1}{n-1}\sum_{i=1}^{n}(X_i-\bar X)^k vk=n−11∑i=1n(Xi−Xˉ)k,其中, v