简单线性相关案例-求相关系数

pandazdy

已于 2022-04-13 12:35:33 修改

阅读量8.4k

点赞数 3

分类专栏：数据分析方法论文章标签：经验分享

于 2022-04-13 12:26:20 首次发布

本文链接：https://blog.csdn.net/weixin_44556829/article/details/124144302

版权

数据分析方法论专栏收录该内容

3 篇文章

订阅专栏

这篇博客通过计算广告费用与销售收入的相关系数来分析两者之间的关系。数据显示，在十年间，随着广告费用的增加，销售收入呈现正相关趋势，相关系数约为0.9552，表明两者之间存在极强的正相关性。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

【例子】下面是某广告公司的广告费用与销售收入相关系数计算表

年份	广告费用/万元x	销售收入/万元y
2001	2	50
2002	2	51
2003	3	52
2004	4	53
2005	5	53
2006	6	54
2007	6	55
2008	6	56
2009	7	56
2010	7	57

n = 数量 = 10

∑x=2+2+3+4+5+6+6+6+7+7=48

∑y=50+51+52+53+53+54+55+56+56+57=537

∑x²=2²+2²+3²+4²+5²+6²+6²+6²+7²+7²=264

∑y²=50²+51²+52²+53²+53²+54²+55²+56²+56²+57²=28885

∑xy=2*50+2*51+3*52+4*53+5*53+6*54+6*55+6*56+7*56+7*57=2616

$r=\frac{\sigma _{xy}2 }{\sigma _{x}\cdot \sigma _{y}}= \frac{ \frac{\sum \left ( x-\overset{-}{x} \right ) \left ( y-\overset{-}{y} \right )} {n}} {\frac{\sqrt{\left ( x- \overset{-}{x}\right )^{2}}}{n} \frac{\sqrt{\left ( y- \overset{-}{y}\right )^{2} }}{n}}= \frac{\sum ( x-\overset{-}{x} )( y-\overset{-}{y} ) } {\sqrt{\sum (x-\overset{-}{x})^{2}(y-\overset{-}{y})^{2} }}= \frac{n\sum xy-\sum x \cdot \sum y} { \sqrt{n\sum y^{2}-(\sum y)^{2}} \cdot \sqrt{n\sum y^{2}-(\sum y)^{2}} }$

第三个等号右边公式错了，把分母圆点左边的y全部换成x即可，编辑的公式变成了图像无法修改，编辑公式太痛苦了我哭死

代入公式：

先解释一下：相关系数r=xy的协方差/xy的标准差的乘积，协方差就是我们所说的cov xy

相关系数r = $\frac{n\sum xy-\sum x \cdot \sum y} { \sqrt{n\sum y^{2}-(\sum y)^{2}} \cdot \sqrt{n\sum y^{2}-(\sum y)^{2}} }$

= $\frac{10*2616-48*537} {\sqrt{10*264-48^{2}}*\sqrt{10*28885-537^{2}}}$

= $\frac{384}{402.01}$

≈0.9552

性质：

相关系数	相关性
\|r\|=1	完全线性相关
0.8<\|r\|=1	极强相关
0.6<\|r\|<=0.8	强相关
0.4<\|r\|<=0.6	中等程度相关
0.2<\|r\|<=0.4	弱相关
0.0<\|r\|<=0.2	极弱相关
\|r\|=0	完全不相关