数学建模竞赛知识点汇总（四）——相关性检验

Rosen.

已于 2022-02-13 11:31:46 修改

阅读量3.2k

点赞数

分类专栏：数学建模文章标签：数学建模

于 2022-02-13 11:30:56 首次发布

本文链接：https://blog.csdn.net/Rosen_er/article/details/122906797

版权

数学建模专栏收录该内容

6 篇文章

订阅专栏

本文详细介绍了数学建模中相关性检验的重要概念，包括皮尔逊相关系数和斯皮尔曼相关系数的计算及假设检验流程。皮尔逊系数用于衡量线性相关程度，适合正态分布的连续数据；而斯皮尔曼系数适用于非正态分布或等级数据。文章还提到了相关性检验的前提条件和Q-Q图等检验方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

数学建模竞赛知识点汇总（四）——相关性检验

文章目录

数学建模竞赛知识点汇总（四）——相关性检验

简介

相关性分析是研究两个或两个以上的随机变量间的相关关系的统计分析方法，例如降水与地形、降水与温度等的相关关系。相关分析前，首先通过散点图了解变量间大致的关系情况。如果变量之间不存在相互关系，那么在散点图上就会表现为随机分布的离散的点，如果存在某种相关性，那么大部分的数据点就会相对密集并以某种趋势呈现。
在这里插入图片描述

皮尔逊相关系数

总体person相关系数

$\rho_{X Y}=\frac{\operatorname{Cov}(X, Y)}{\sigma_{x} \sigma_{y}}$
$\sigma_{x}=\sqrt{\frac{\sum_{i=1}^{n}\left(X_{i}-E(X)\right)^{2}}{n}} 与 \sigma_{y}=\sqrt{\frac{\sum_{i=1}^{n}\left(Y_{i}-E(Y)\right)^{2}}{n}}分别是X 总体与 Y 总体的方差。$

$\operatorname{Cov}(X, Y)=\frac{\sum_{i=1}^{n}\left(X_{i}-E(X)\right)\left(Y_{i}-E(Y)\right)}{n} 为总体的协方差。$

样本person相关系数

$r_{X Y}=\frac{\operatorname{Cov}(X, Y)}{S_{x} S_{y}}$
$S_{x}=\sqrt{\frac{\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)^{2}}{n-1}}与S_{y}=\sqrt{\frac{\sum_{i=1}^{n}\left(Y_{i}-\bar{Y}\right)^{2}}{n-1}} 分别是 X样本与Y样本的方差。$

$\operatorname{Cov}(X, Y)=\frac{\sum_{i=1}^{n}\left(X_{i}-\bar{X}\right)\left(Y_{i}-\bar{Y}\right)}{n-1} 为样本的协方差。$

Tips：皮尔逊相关系数只是用来衡量两个变量线性相关程度的指标，所以必须确定这两个变量是线性相关的，才能够表示线性相关程度。相关系数的结果为0，只能说明他们是非线性相关的，但不能表明其没有相关关系。

皮尔逊相关系数假设检验

前提步骤

前提条件

实验数据通常假设是成对的来自于正态分布的总体。
实验数据之间的差距不能太大。
每组样本之间是独立抽样的。

对数据进行正态分布检验

雅克-贝拉检验（适用于较大样本数）
夏皮诺-威尔克检验（Shapiro‐wilk检验）

夏皮诺-威尔克检验适用于小样本。
Q-Q图

在统计学中，Q‐Q图（Q代表分位数Quantile）是一种通过比较两个概率分布的分位数对这两个概率分布进行比较的概率图方法。

流程

提出原假设与备择假设, $H_{0}: r=0, H_{1}: r \neq 0$ 。
构造检验统计量

$\sqrt{\frac{n-2}{1-r^{2}}} \sim t(n-2)$
服从自由度为 2 的 $t$ 分布

计算出检验值(代入数据)得到 $t^{*}$ 。
使用 $p$ 检验

计算 $p$ 值

$\times\left(1-\int_{-\infty}^{t^{*}} t(x) d x\right)$
5. 结果说明

$p < 0.01 :$ 在 $\%$ 的置信水平上拒绝原假设。
$0.01 < p < 0.05$ : 在 $\%$ 的置信水平上无法㫜色原假设，但在 $\%$ 的水平上可以拒绝原假设。
$0.05 < p < 0.1 :$ 在 $\%$ 的置信水平上无法拒绝原假设，但在 $\%$ 的水平上可以拒绝原殿设。

斯皮尔曼相关系数

$X, Y$ 为两组数据，其斯皮尔晶(等级)相关系数:
$r_{s}=1-\frac{6 \sum_{i=1}^{n} d_{i}^{2}}{n\left(n^{2}-1\right)}$
$d_{i}$ 为 $X_{i}$ 与 $Y_{i}$ 之间的等级差。 $\left(-1 \leq r_{s} \leq 1\right)$ 。