相关系数
基础概念
总体
所要考察对象的全部个体叫做总体
样本
从总体中所抽取的一部分个体叫做总体的一个样本.
皮尔逊相关系数
总体
样本
误区
通过上面2种特殊情况,我们可以看出
(1)非线性相关也会导致线性相关系数很大。
(2)离群点对相关系数的影响很大。
(3)如果两个变量的相关系数很大也不能说明两者相关。
(4)相关系数计算结果为0,只能说不是线性相关,但说不定会有更复杂的相关 关系(非线性相关)。
相关系数的大小
上表所定的标准从某种意义上说是武断的和不严格的。
对相关系数的解释是依赖于具体的应用背景和目的的。
总结
(1)如果两个变量本身就是线性的关系, 那么皮尔逊相关系数绝对值大的就是相关性强,小的就是相关性弱; (2)在不确定两个变量是什么关系的情况下,即使算出皮尔逊相关系数,发现很大, 也不能说明那两个变量线性相关,甚至不能说他们相关,我们一定要画出散点图来看才 行
matlab中的一些常用函数
计算皮尔逊相关系数
corrcoef函数
假设检验
优化 p值判别法
使用条件
如何检验数据是否是正态分布?
JB检验
偏度和峰度
雅克‐贝拉检验(Jarque‐Beratest)
Shapiro-wilk检验
用于小样本3≤n≤50
Q-Q图
斯皮尔曼spearman相关系数
定义
举例
用matlab计算
假设检验
小样本(<=30)
直接查临界值表
大样本(>30)
两种相关系数的比较
定序数据是指仅仅反映观测对象等级、顺序关系的数据,是由定序尺度计量形成的,表现为类别,可以进行排序,属于品质数据。
正态分布均值的假设检验
例题
分析
定义机械正常
求解步骤
(1)写出原假设和备择假设
(2)在原假设成立 的条件下,构造一个统计量,该统计量服从某一分布
(3)用已知的样本数据带入 统计量的公式,得到一个检验值
(4)给定置信水平来得到一个接受域的区间, 看检验值是否落在接受域中,或者用检验值和区间的临界值进行比较,来判断是否接受原假设
Z检验
t检验
例题
两个正态总体均值差的检验
逐对比较法
有时为了比较两种产品、两种仪器、两种方法等的差异,我们常 在相同的条件下做对比试验,得到一批成对的观察值,然后分析观察 数据作出推断。这种方法常称为逐对比较法。