相关系数评价标准的相关知识

作者:niaocu
链接:https://www.zhihu.com/question/51784983/answer/127640857
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

说来话长,正好我讲过这一章,所以就从课件中复制粘贴过来(资料来源是David S. Moore的 《统计学的世界》),我尽量剪短一点(主要是公式太难粘贴,相信你可以在任何一本统计学书上找到下文所涉及的公式)。如果嫌前面背景介绍太麻烦,请直接到最后一段——

线性关系straight-line)是相当重要的一种变量间的关系——它虽然简单但却很普遍。如果(散点图)中的点越接近一条直线,那么线性关系就越强,如果越散乱,则线性关系越弱。有一种数字方法可以帮助我们描述这种线性相关关系有多强,这个数字就是correlation——相关系数r(计算公式略)。。。


------相关系数背景知识-----

相关系数的含义 Understanding Correlation

比计算r(a task for a machine)更重要的是了解correlation是如何衡量相关关系。以下是关于r的几个事实:

r正号正相关、负号负相关(Positive r indicatespositive association between the variables, and negative r indicates negativeassociation.)。

r值介于[-1, 1]之间(The correlation r always fallsbetween –1 and 1)。r值越接近0,相关度越弱(等于0,线性无关),随着r值往-1或1移动,相关度增强,越接近-1或1,则points越接近一条直线。如果是取到极端值(r = -1和r = 1),则散点图的points就是在一条直线上。
rx, y变量的单位无关,改变变量的单位并不影响它们之间的相关关系(Becauser use standard scores, the correlation between x and y does notchange when we change the units of measurement of x, y, or both)。r本身没有单位。

r不对自变量和因变量进行区分(Correlation ignoresthe distinction between explanatory and response variables)。如果对调我们对xy的选择,r仍旧不变。

r只衡量两个变量之间线性相关关系(straight-line association)的强弱。但无法描述两个变量间的曲线关系(curved relationships),不论这种曲线关系有多强。——即使r显示两个变量间线性无关,也无法断定两个变量间没有线性以外的关系。


----相关系数深入知识----

Correlation & regression 相关系数与回归

在线性回归分析中还经常可以看到r2——相关系数的平方,又叫相关判定系数。


r2 就是变量y值的变动能用回归直线来解释的比例(the fraction of the variation in the values of y that is explained by the least-squares regression of y on x)。其中的意义在于,假如存在直线回归关系,则y值的变动之中有一部分是由于x的变化引起的——x沿着回归直线拉动y值。涉及三个概念:


a. y的变动(Total sum of squares)——y的观测值yi围绕y均值的变动(Measures variation of observed yi around the mean),即SST

b. 可解释的变动(Explained variation)——由于xy存在线性关系引起的变动(Variation due torelationship between x & ySSR

c. 不可解释的变动(Unexplained variation)——由于其它因素引起的变动(Variationdue to other factor),即SSE

三者的关系:SST = SSR + SSE,总变动 = 可解释变动 + 不可解释变动,如图


r2= 可预测的因x的变动引起的y在回归直线上变动 / y观测值的总变动

= 可解释变动 / 总变动

=SSR/SST


运用该方法计算出来的r2,与先计算相关系数r之后,再平方得到的是同一个数(计算相关系数r的另一个方法——先求r2,然后再开根号,但缺点是不能判断正负号(不知道相关的方向。)。由r2的计算公式可知,0≤r2≤1。r2的含义


► 当r = ±1时,r2= 1,所有的点都在同一条直线上。直线关系解释所有y的变动(SST=SSR、y的变动全部由于x的变动引起),回归直线能完美预测y值。

► 当r≠±1且r≠0时,0<r2<1时(SST>SSR),线性关系能部分解释y的变动(所解释的部分就是r2所代表的值)。如前面施肥与产量的例子r = .956,r2=.914,亦即产量y的变动中大约有有91%能由与施肥量x线性关系来解释。

► 当r = 0,r2= 0,y的全部无法由于线性关系解释。


在回归预测中,通常用r2来衡量如果以回归模型来解释因变量有多成功(how successful the regressionwas in explaining the response)。如果提供的是相关系数,将其平方后你就能更好的理解线性关系的强弱。比如:如果r = ±.7,则两个变量线性相关关系介于线性无关(r = 0)和完全线性相关( r = ±1)的“半路上”,因为(.7)^2= 0.49。课本上的练习和例子一般提供的r(甚至r2)都大于.9(高度相关),现实中只要回归模型的r2在.4、.5甚至.3(即相当于r在.5以上)就可以认为其拟合度相当高,可以利用其进行线性关系预测。


——资料来源:David S. Moore, 《统计学的世界》,中信出版社,2003年11月


问题到这里,你就知道为何

“相关系数 0.8-1.0 极强相关
0.6-0.8 强相关
0.4-0.6 中等程度相关
0.2-0.4 弱相关
0.0-0.2 极弱相关或无相关 ”

了吧?把相关系数平方一下。
  • 3
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评委评审质量的评价指标建模是为了客观、准确地衡量评委的评审质量并提供参考依据。在建模过程中,可以考虑以下几个评价指标: 1. 评审专业能力:评委应具备丰富的专业知识和经验,评价指标可以包括学历、资格认证、职称等。评委参与过的同类型项目数量和质量也可以作为评价指标之一。 2. 评审结果的准确性:评委给出的评审结果应与实际情况相符合。可通过与实际项目结果的比对,计算评审结果的正确率、偏差等指标。 3. 评审意见的可操作性:评委提供的评审意见应具备一定的可操作性,即能够指导被评审项目的改进与提升。评价指标可以从评审意见的针对性、可实施性等方面进行考量。 4. 评审过程的公正性:评委的评审过程应公正、客观,并严格遵守相关的评审规则和程序。评价指标可以包括评审过程的透明度、公开性、评审结果的一致性等。 5. 评委的时间和工作投入:评委在评审过程中所投入的时间和工作量也是一个重要的考量因素。评价指标可以包括评审时间、评审文件的完成质量等。 综上所述,评委评审质量的评价指标建模需要考虑评审专业能力、评审结果的准确性、评审意见的可操作性、评审过程的公正性以及评委的时间和工作投入等方面。建立这样的评价指标体系可以提高评审质量的客观性和准确性,为评审过程和结果的改进提供有力的支持和指导。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值