相似度计算(euclidean, cosine, pearson)

本文介绍了三种常用的相似度计算方法:欧氏距离(Euclidean Distance)、余弦相似度(Cosine Similarity)和皮尔逊相关系数(Pearson Correlation Coefficient)。欧氏距离衡量的是两个向量在几何空间中的直线距离;余弦相似度关注的是向量的方向,而非长度;皮尔逊相关系数则评估两个变量间线性关系的强度和方向。这三种方法广泛应用于数据挖掘、信息检索等领域,用于评估数据点之间的相似性。
摘要由CSDN通过智能技术生成

#!/usr/bin/python
from math import sqrt

def euclidean(v1, v2):
    length = min(len(v1), len(v2))
    if length == 0: return 0
    
    d = 0
    for i in range(length):
        d += pow((v1[i] - v2[i]), 2)
    #return sqrt(d)
    return 1 / float(1+d)

def cosine(v1, v2):
    length = min(len(v1), len(v2))
    if length == 0: return 0
    
    dp = 0 #dot product
    m1 = 0 #modulus of v1
    m2 = 0 #modulus of v2
    for i in range(length):
        dp += v1[i] * v2[i]
        m1 += v1[i] * v1[i]
        m2 += v2[i] * v2[i]
    
    if m1 == 0 or m2 == 0: return 0
    distance = dp / (sqrt(m1) * sqrt(m2))
    return distance

def pearson(v1, v2):
    length = min(len(v1), len(v2))
    if length == 0: return 0
    
    #e of v1 v2
    e1 = 0
    e2 = 0
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值