基于余弦(欧式距离)的聚类

参考这篇文章考虑质心问题:https://blog.csdn.net/xiaokang123456kao/article/details/74840843

欧式距离和余弦相似度的关系

欧氏距离能够体现个体数值特征的绝对差异,所以更多的用于需要从维度的数值大小中体现差异的分析,如使用用户行为指标分析用户价值的相似度或差异。

余弦距离更多的是从方向上区分差异,而对绝对的数值不敏感,更多的用于使用用户对内容评分来区分兴趣的相似度和差异,同时修正了用户间可能存在的度量标准不统一的问题(因为余弦距离对绝对数值不敏感)。原文

sklearn的模块简介

计算两个点之间的欧氏距离:

import numpy as np
def ed(m, n):
    return np.sqrt(np.sum((m - n) ** 2))

i = np.array([1, 1])
j = np.array([3, 3])
distance = ed(i, j)
print(distance)

计算一个点到其他所有点的距离值之和:

# airportPosition是矩阵中的某一个点
# x_vals是矩阵中所有的点
distances = np.sqrt(np.sum(np.asarray(airportPosition - x_vals)**2, axis=1))

distances是某一个点到所有点的距离矩阵

来自脚本之家

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值