皮尔逊相关系数的计算以及数据的描述性统计
关于皮尔逊相关系数的一些理解误区
注:皮尔逊只能描述线性关系
所以先画散点图大致看一下点的走向,是不是线性关系,再用皮耳孙相关系数
相关系数大小解释
一些excel的快捷操作
ctrl+➡快速跳转到最后一列
ctrl+shift+➡选中此行
ctrl+shift+➡+⬇全选(左上角)
例题:八年级女生体测数据
或者使用excel中的数据分析 5-1 35min处或者参考ppt
利用matlab将一些基本量求出来,得到此数据的描述性统计(很重要,可以写到论文里)
用SPSS分析数据:
标度:数值型,如身高体重
有序:如,甲乙丙丁
名义:没有顺序,如性别
导入数据怎么分析?
分析--
移动变量的快捷方法:ctrl+A 全选
然后选择想分析的,点确定就会有一个计算好的表格了
分析两个数据之间的线性关系?
选 图形---旧对话框---散点图/点图---矩形---定义---选择矩阵变量---确定
美化相关系数表格
调正单元格大小:
条件格式---管理规则---编辑规则
改成这样也可
假设检验
step1:确定原假设和备择假设
step2:构造分布 正态,t分布,F分布,X方分布
step3:画概率密度图
step4:给出置信水平
同概率论
皮尔逊相关系数进行假设检验
tpdf是matlab中的一个函数,28是服从自由度为28的分布
https://wenku.baidu.com/view/d94dbd116bd97f192279e94a.html
t分布表
计算各列之间的相关系数以及p值
*** 99%显著 P<0.01 在99%水平上拒绝原假设(说明对原假设很保护呗,也侧面说明这个数据偏离μ有点大
** 95%显著 0.01<P<0.05
* 90%显著 0.05<P<0.1
你想证明一班的成绩比二班好:
那么原假设H0 就设为一班二班成绩相同,其中出现的个别成绩有差异,是由于抽样误差所造成的,纯在偶然性,差异数据不具备统计学意义,可以忽略该差异的影响
备择假设H1就设为一班比二班成绩好,其中样本中出现的一班二班成绩差异不是偶然出现的,具有高度统计学意义,不可忽悠该差异的影响
P:在定义了H0的情况下,代表了由于偶然误差导致的H0不成立的碰巧可能性大小。
P小,拒绝H0的出错的概率就小,所以不能接受H0
P大,拒绝H0的出错的概率就大,所以要接受H0
因此, 当把显著性水平设定为0.05时,
当P值小于0.05时, 我们认为因为偶然性而造成的成绩差异的概率比较小,该差异具备统计学意义,该差异不是由于偶然性的抽样导致的,而是两组数据之间的差异存在着显著意义,因此无法忽略该差异,不能接受H0.
因此拒绝原假设,就可以接受一班成绩比二班好的事实;
2. 若P值比0.05大,就原假设中因为抽样误差而造成的成绩差异的可能性比较高,说明没有足够证据证明一班成绩比二班好,保守起见拒绝备择假设 接受原假设
(转自知乎)
SPSS操作
分析---相关---双变量
选择双变量
双尾是双侧检验的意思
皮尔逊相关系数假设检验条件
(检验是不是正态分布)
正态分布JB检验
要求数据量大于30
[h,p]=jbtest(Test(:,1),0.05)
核心代码,h只有两个值,0和1 ,1表示服从正态分布 ;p是显著性水平
夏皮洛-威尔克检验
小样本分析
利用SPSS分析
分析---描述统计---探索
点击 图
勾选含检验的正态图
看最后一列,都是0,落入拒绝域内,所以拒绝原假设(就不是正态分布)
QQ图
要求数据量非常大,只需要看点是否在一条直线上
在一条直线上说明是正态分布
斯皮尔曼相关系数
注意:4.5就是 (4+5)/2
rs小于0 负相关