本文内容根据Datawhale和GitModel开源学习教程整理,学习链接:https://github.com/Git-Model/Modeling-Universe/tree/main/Data-Story
感谢课程开发者的付出与贡献!
本节作业链接:戳我进入
文章目录
3 多元数值向量的假设检验
- 单变量问题和多变量问题的区别:
- 单变量问题研究的是具体某一个指标的性质
- 多变量问题将多个指标作为一个整体,用它们去描述一个对象的性质
3.1 均值向量的检验
- 主要内容:
- 比较一组数据的总体均值向量与一个固定向量是否相等的检验
- 比较两组数据的总体均值向量之间是否相等的检验
- 比较两组以上的多组数据的总体均值向量之间是否相等的检验
3.1.1 单组样本均值向量假定的检验
-
单组样本均值向量检验与单组样本的均值检验类似,假定的对象从一个数值变成一个向量,可以使用单样本hotelling T2检验
设 x 1 , ⋯ , x n x_{1}, \cdots, x_{n} x1,⋯,xn 来一个 p p p 元正态分布的一个样本。对于单样本hotelling T2检验,我们做如下 两个假设:
H 0 : μ = μ 0 ↔ H 1 : μ ≠ μ 0 H_{0}: \mu=\mu_{0} \leftrightarrow H_{1}: \boldsymbol{\mu} \neq \mu_{0} H0:μ=μ0↔H1:μ=μ0
注意,这里的 μ \mu μ 是加粗的,代表向量
检验统计量为:Test statistics = n − p p ( n − 1 ) T 2 , T 2 = n ( x ˉ − μ 0 ) ′ S − 1 ( x ˉ − μ 0 ) =\frac{n-p}{p(n-1)} T^{2}, T^{2}=n\left(\bar{x}-\mu_{0}\right)^{\prime} S^{-1}\left(\bar{x}-\mu_{0}\right) =p(n−1)n−pT2,T2=n(xˉ−μ0)′S−1(xˉ−μ0)
其中, S S S 样本的无偏协方差矩阵
检验统计量服从分布 Test statistics ∼ F ( p , n − p ) \sim F(p, n-p) ∼F(p,n−p)
p值计算公式为 pvalue = P ( F > =P(F> =P(F> Test statistics ) ) )- 尽管备择假设的符号是 ≠ \neq =,但这里p值并不是双边p值,多元检验中p值形式的判断并不不能沿用一元均值检验的判断方法
-
举例Example5:想研究某地区农村2岁男婴的发育状况是否达到国家参考标准,于是抽取6名男婴并测量了他们的身高 x 1 x_{1} x1 、胸围 x 2 x_{2} x2 、上半臀围 x 3 x_{3} x3 。已知这三个指标的国家参考标准均值为 μ 0 = (