统计学 分类数据分析
- 分类数据和 x 2 x^2 x2统计量
- 拟合优度检验
- 列联分析: 独立性检验
- 列联表的相关系(三个系数)
1.分类数据和 x 2 x^2 x2统计量
分类数据
x 2 x^2 x2统计量
其中 k为求和的项数, l 为要估计的参数个数
具体的参数含义可以结合下面的案例来理解
2.拟合优度检验
直接进入案例
例1
-
步骤1:分析 H0与H1
H0 :观察频数与期望频数一致 -
步骤2: 构造统计量
- 1.在本题中不用估计参数,参与求和的项数为2,所以自由度为2-0-1=1
- 2.根据原来的男女比例估计期望的男女存活 的人数
- 3.代入计算
-
步骤3.得出结论
例2
- 步骤1:分析 H0与H1
H0 :观察频数与期望频数一致 - 步骤2: 构造统计量
- 1.在本题中估计参数为λ,l=1,参与求和的项数为4,所以自由度为2-0-1=1
注,这里的 k=4是因为手动把 >=3的数据都归为一类
λ的估计: 因为H0假设服从参数为λ的泊松分布,泊松分布的表达式入下
因此使用频数分布表计算出期望
λ = 0 ∗ 109 / 200 + 1 ∗ 65 / 200 + 2 ∗ 22 / 200 + 3 ∗ 3 / 200 + 4 ∗ 1 / 200 = 0.6100000000000001 ≈ 0.61 λ = 0*109/200 + 1*65/200+2*22/200+3*3/200+4*1/200=0.6100000000000001 ≈0.61 λ=0∗109/200+1∗65/200+2∗22/200+3∗3/200+4∗1/200=0.6100000000000001≈0.61
根据泊松分布的表达式计算出k为0,1,2,3时的概率,得到下表
带入公式求得统计量
- 1.在本题中估计参数为λ,l=1,参与求和的项数为4,所以自由度为2-0-1=1
- 步骤3: 带入得出结论
3.列联分析: 独立性检验
RT/CT为该行/列的求和
话不多说,看例题来理解
例1
解析
H0:地区和原料等级之间是独立的(不存在依赖关系)
H1:地区和原料等级之间不独立 (存在依赖关系)
计算
其中
45.36
=
140
/
500
∗
162
/
500
∗
500
=
140
∗
162
/
500
=
45.36=140/500*162/500*500=140*162/500=
45.36=140/500∗162/500∗500=140∗162/500=
统计量
自由度为(3-1)*(3-1)=4
累加
(
52
−
45.36
)
2
/
45.36
以
此
类
推
(52-45.36)^2/45.36 以此类推
(52−45.36)2/45.36以此类推
得出结论
4.3个相关系数的计算
注,下文中的 x 2 x^2 x2均为统计量