一、统计量
1.1 统计量
统计量:由样本构造的一个函数,且不依赖于任何未知参数。
统计量是统计推断的基础
次序统计量:
样本值有序
中位数、分位数、四分位数都是次序统计量
二、分布
2.1 抽样分布
样本统计量的概率分布,是一种理论分布
重复选取样本容量为n的样本时,该统计量所有可能的取值形成的相对频数分布
样本统计量是随机变量
结果来自容量相同的所有可能样本
2.2 正态分布
∙ 分布函数的概念:
函数F(X)= P(X<= x)为X的分布函数,表示随机变量X小于等于x的概率
分布函数完整的描述了随机变量X的统计规律性
概率密度:
它是分布函数的一阶导数
性质:
f(x)> 0
连续性的随机变量的取值在任意一点概率为0
概率密度在个别点上的取值不会影响随机变量的表现
∙ 正态分布:
概率密度
正态分布描述:
μ 描述正态分布的集中程度
α 描述正态分布离散程度
越大,数据越分散;越小,数据越集中
正态分布曲线面积:
68.27%的数据在平均值左右的一个标准差范围内
95.45%的数据在平均值左右的两个标准差范围内
99.73%的数据在平均值左右的三个标准差范围内
99.99%的数据在平均值左右的四个标准差范围内
正太分布衍生的分布:
卡方分布(验证两组离散变量的相关性)
t分布(小样本,小于30),检验期望
F分布