相关系数
本讲我们将介绍两种最为常用的相关系数:皮尔逊 pearson相关系数和斯皮尔曼spearman等级相关系数。 它们可用来衡量两个变量之间的相关性的大小,根据 数据满足的不同条件,我们要选择不同的相关系数进 行计算和分析(建模论文中最容易用错的方法)
总体和样本
总体——所要考察对象的全部个体叫做总体. 我们总是希望得到总体数据的一些特征(例如均值方差等)
样本——从总体中所抽取的一部分个体叫做总体的一个样本.
计算这些抽取的样本的统计量来估计总体的统计量:
例如使用样本均值、样本标准差来估计总体的均值(平均 水平)和总体的标准差(偏离程度)。 例子: 我国10年进行一次的人口普查得到的数据就是总体数据。 大家自己在QQ群发问卷叫同学帮忙填写得到的数据就是样本数据
总体皮尔逊Pearson相关系数
回顾《概率论与数理统计》中的数理统计部分:
直观理解协方差:如果X、Y变化方向相同,即当X大于(小于)其均值时,Y也 大于(小于)其均值,在这两种情况下,乘积为正。如果X、Y的变化方向一直 保持相同,则协方差为正;同理,如果X、Y变化方向一直相反,则协方差为负; 如果X、Y变化方向之间相互无规律,即分子中有的项为正,有的项为负,那么 累加后正负抵消。
注意:协方差的大小和两个变量的量纲有关,因此不适合做比较
条件1-相关性
你必须先确定 这两个变量是线性相关的,然后这个相关系数才能告诉你 他俩相关程度如何
皮尔逊相关系数的计算
如何美化相关系数表
操作步骤总结
对皮尔逊相关系数进行假设检验-5步
更好用的方法:p值判断法
皮尔逊相关系数假设检验的条件
正态分布JB检验(大样本n>30)
小样本3≤n≤50:Shapiro-wilk检验
另一种常见的方法:Q-Q图
在统计学中,Q‐Q图(Q代表分位数Quantile)是一种通过比较两个概 率分布的分位数对这两个概率分布进行比较的概率图方法。 首先选定分位数的对应概率区间集合,在此概率区间上,点(x,y)对应 于第一个分布的一个分位数x和第二个分布在和x相同概率区间上相同的分 位数。 这里,我们选择正态分布和要检验的随机变量,并对其做出QQ图, 可想而知,如果要检验的随机变量是正态分布,那么QQ图就是一条直线。
要利用Q‐Q图鉴别样本数据是否近似于正态分布,只需看Q‐Q图上的点 是否近似地在一条直线附近。(要求数据量非常大)
斯皮尔曼spearman相关系数
斯皮尔曼相关系数的假设检验
两个相关系数的比较
ppt 的截屏是清风老师的 问过他的允许了
可以去b站搜清风数学建模 了解了解 后面部分要看完整视频是要钱的(个人觉得性价比是非常可以的)