预测类_相关性分析 (清风数学建模)

相关系数

本讲我们将介绍两种最为常用的相关系数:皮尔逊 pearson相关系数斯皮尔曼spearman等级相关系数。 它们可用来衡量两个变量之间的相关性的大小,根据 数据满足的不同条件,我们要选择不同的相关系数进 行计算和分析(建模论文中最容易用错的方法)

总体和样本

总体——所要考察对象的全部个体叫做总体. 我们总是希望得到总体数据的一些特征(例如均值方差等)

样本——从总体中所抽取的一部分个体叫做总体的一个样本.

计算这些抽取的样本的统计量来估计总体的统计量

例如使用样本均值、样本标准差来估计总体的均值(平均 水平)和总体的标准差(偏离程度)。 例子: 我国10年进行一次的人口普查得到的数据就是总体数据。 大家自己在QQ群发问卷叫同学帮忙填写得到的数据就是样本数据

总体皮尔逊Pearson相关系数

回顾《概率论与数理统计》中的数理统计部分:

直观理解协方差:如果X、Y变化方向相同,即当X大于(小于)其均值时,Y也 大于(小于)其均值,在这两种情况下,乘积为正。如果X、Y的变化方向一直 保持相同,则协方差为正;同理,如果X、Y变化方向一直相反,则协方差为负; 如果X、Y变化方向之间相互无规律,即分子中有的项为正,有的项为负,那么 累加后正负抵消。

注意:协方差的大小和两个变量的量纲有关,因此不适合做比较

条件1-相关性

你必须先确定 这两个变量是线性相关的,然后这个相关系数才能告诉你 他俩相关程度如何

皮尔逊相关系数的计算

如何美化相关系数表

操作步骤总结

对皮尔逊相关系数进行假设检验-5步

更好用的方法:p值判断法

皮尔逊相关系数假设检验的条件

正态分布JB检验(大样本n>30)

小样本3≤n≤50:Shapiro-wilk检验

另一种常见的方法:Q-Q图

在统计学中,Q‐Q图(Q代表分位数Quantile)是一种通过比较两个概 率分布的分位数对这两个概率分布进行比较的概率图方法。 首先选定分位数的对应概率区间集合,在此概率区间上,点(x,y)对应 于第一个分布的一个分位数x和第二个分布在和x相同概率区间上相同的分 位数。 这里,我们选择正态分布和要检验的随机变量,并对其做出QQ图, 可想而知,如果要检验的随机变量是正态分布,那么QQ图就是一条直线。

要利用Q‐Q图鉴别样本数据是否近似于正态分布,只需看Q‐Q图上的点 是否近似地在一条直线附近。(要求数据量非常大)

斯皮尔曼spearman相关系数

斯皮尔曼相关系数的假设检验

两个相关系数的比较

ppt 的截屏是清风老师的 问过他的允许了  

可以去b站搜清风数学建模 了解了解  后面部分要看完整视频是要钱的(个人觉得性价比是非常可以的)

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值