数据分布
抽样分布
定义
抽样分布也称统计量分布、随机变量函数分布,是指样本估计量的分布。描述性统计指标也被简称为参数。连接样本参数和总体参数的桥梁就是抽样分布。
中心极限定理
中心极限定理就是不论总体服从什么分布,只要从总体中抽取的样本容量足够大,这些样本组成的样本均值的抽样分布都近似于正态分布。
1,Z分布
z统计量
将转换成标准正态分布的均值抽样分布称为Z分布,Z分布的变量称为Z统计量或Z分数
第一个位有放回抽样,第二个为无放回抽样
服从正态分布的均值抽样分布也可以由均值和方差确定,表示为
· 均值抽样分布均值等于总体均值(μc=μz);
· 均值抽样分布方差可由总体方差间接计算
Z分布只能覆盖部分均值抽样分布的情况,它特别适合总体标准差σz已知的正态分布总体或样本容量大于或等于30的任意分布总体的抽样情况。
2,T分布
如果已知等待分析的总体服从正态分布,从总体中抽取容量为n的所有可能样本,对每个样本都计算出它们相应的T统计量,则所有T统计量的值将组成一个连续型概率分布,这个分布就是T分布,T分布的概率密度函数为:
·t代表T统计量的值;
·v表示自由度,等于样本容量n减去1;
·c为常数,使T分布函数曲线下的面积等于1。
T统计量
·x-代表样本均值;s代表样本标准差;μ代表总体均值;
· ν代表自由度;n代表样本容量;t代表T统计量的值。
切比雪夫定理
P(μ±ks)≥1-1/k2
对于给定的总体,位于区间[μ-kσ,μ+kσ]内的个案比例至少等于1-1/k2
3,卡方(χ2 )分布
卡方(χ2)统计量
s2代表样本方差;· σ2代表总体方差;(n-1)代表自由度。
概率密度函数
· χ2代表卡方统计量;e是自然底数,等于2.72;
·v代表自由度,等于样本容量n-1;
·c代表调节常数,使得卡方分布曲线下方的总面积等于1。
4,F分布(方差比分布)
F统计量
两个正态分布总体之间的方差关系
F统计量其实可以被认为是由两个卡方(χ2)统计量相除得到的,一般情况是默认将卡方值较大的总体作为分母,卡方值较小的总体作为分子。
概率密度函数
v1表示F统计量分子的自由度; v2表示F统计量分母的自由度;
c代表修正常数,它使得F分布曲线下方的总面积等于1。
F分布能够用于推断两个总体方差之间的比值关系