1.皮尔逊相关系数

1.皮尔逊相关系数-两变量关联性分析

世间万物是普遍联系的.

客观现象之间的数量联系存在着函数关系和相关关系。当一个或几个变量取定值时,另一个变量有确定的值与之对应,称为函数关系,可用Y=f(x)表示.当一个变量增长,另一个也随之增大(或减少),称这种现象为相关。

两个变量有相关现象,称为相关关系.相关关系不一定是因果关系.

 

主要探讨线性相关-Pearson相关关系

散点图

为了确定相关变量之间的关系,首先应该收集一些数据,这些数据应该是成对的.例如,每人的身高和体重。然后在直角坐标系上描述这些点,这一组点集称为散点图.

 

例子

为了研究父亲与成年儿子身高之间的关系,卡尔.皮尔逊测量了1078对父子的身高,把1078对数字表示在坐标上.如图,用水平轴X上的数字代表父亲身高,垂直轴Y上的数代表儿子的身高,1078个点所形成的图形是一个散点图.

它的形状想一块橄榄状的云,中间的点密集。边沿的点稀少,其主要部分是一个椭圆.

相关联系

作用:粗略地给出了两个变量的关联类型与程度.

通过相关散步图的形状,大概可以判断变量之间相关程度的强弱,方向和性质,但不能得知其相关的确切程度。

为精确了解变量间的相关程度,求出描述变量间相关程度与变化方向的量数,即相关系数.总体相关系数用P表示,样本相关系数

用r表示.

皮尔逊相关系数的优点包括: 1. 皮尔逊相关系数能够衡量两个变量之间的线性相关程度,可以帮助我们了解变量之间的关系和趋势。 2. 皮尔逊相关系数的取值范围在-1到1之间,可以直观地表示变量之间的相关性,当相关系数接近1,表示两个变量呈正相关关系;当相关系数接近-1,表示两个变量呈负相关关系;当相关系数接近0,表示两个变量之间几乎没有线性关系。 3. 皮尔逊相关系数计算简单,公式容易理解和应用,可以方便地进行数据分析和比较。 皮尔逊相关系数的缺点包括: 1. 皮尔逊相关系数只能衡量线性相关关系,对于非线性关系的数据,可能无法准确反映变量之间的关系。 2. 皮尔逊相关系数对异常值比较敏感,异常值的存在可能会影响相关系数的计算结果,进而影响对变量之间关系的判断。 3. 皮尔逊相关系数只能反映变量之间的线性相关程度,不能说明因果关系,即不能确定变量之间的因果关系是单向的还是相互影响的。 4. 皮尔逊相关系数要求变量服从正态分布,并且要求变量之间的关系是线性关系,对于不满足这些假设的数据,相关系数的计算结果可能不准确。 因此,在使用皮尔逊相关系数,需要考虑数据的性质和相关系数的局限性,结合其他统计方法和领域知识综合分析,以得出更准确和全面的结论。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值