皮尔逊(Pearson)相关系数 - 公式和代码实现

本文介绍了皮尔逊(Pearson)相关系数,用于衡量两个变量间的相关程度。相关系数越大,相关性越强。内容包括相关系数的概念、皮尔逊积差相关的介绍、相关系数的公式及Python代码实现。
摘要由CSDN通过智能技术生成

代码来源于:https://github.com/yaleimeng/Final_word_Similarity
我将其单独抽取、组合出来做讲解。

1. 简介

相关系数:考察两个变量之间的相关程度。相关系数越大,相关性越强。
皮尔逊相关也称为积差相关,是英国统计学家皮尔逊于20世纪提出的一种计算直线相关的方法。

2. 公式

在这里插入图片描述
三个公式都能计算正确结果,我们采用第三个公式来编程实现。

3. 代码实现

from math import sqrt

def multiply(a,b):
    #a,b两个列表的数据一一对应相乘之后求和
    sum_ab=0.0
    for i in range(len(a)):
        temp=a[i]*b[i]
        sum_ab+=temp
    return sum_ab

def cal_pearson(x,y):
    n=len(x)
    #求x_list、y_list元素之和
    sum_x=
皮尔逊相关系数,广泛使用于统计学领域,主要用于评估两个连续变量间的线性关系强度和方向。该指标由卡尔·皮尔逊设计,因此得名。下面是对这一系数的详细介绍: 1. **定义**:皮尔逊相关系数用于度量两个变量X和Y之间的线性相关程度。其值范围从-1到+1,其中-1表示完全的负相关,+1表示完全的正相关,而0则表示两个变量之间没有线性相关性。 2. **数学性质**:相关系数的值受到数据中极端值的影响较大,因此在存在异常值时,皮尔逊相关系数可能不是描述相关性的最佳选择。尽管皮尔逊相关系数为零意味着两变量无线性相关性,但这并不意味着它们之间不存在其他类型的相关性,如非线性相关性。 3. **计算方法**:计算皮尔逊相关系数需要利用两个变量的协方差和它们的标准差。公式可以表示为ρXY = σXσY * cov(X, Y)。其中,cov(X, Y)是X和Y的协方差,σX和σY分别是X和Y的标准差。 4. **几何解释**:可以将皮尔逊相关系数视为在多维空间中,两个变量向量之间角度的余弦值。当两个向量完全同向时,相关系数为+1;完全反向时,为-1;相互独立时,为0。 5. **应用领域**:皮尔逊相关系数不仅应用于基础科学研究,如生物学、心理学和社会学等,还广泛应用于市场研究、金融分析和工程领域,帮助研究者和专业人士理解变量间的关系及其强度。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值