python利用余弦相似度聚类_使用python基于余弦相似度探索人员相关性

本文介绍如何使用Python通过余弦相似度计算人员相关性。首先,通过学生在不同地点的出现频次构建频次矩阵,然后进行数据预处理和正则化,接着计算余弦相似度,并展示了利用sklearn库进行矩阵正则化的代码示例。
摘要由CSDN通过智能技术生成

课题1

毕业设计里面涉及到人员相关度的计算,在这里我提出了一个猜想,大致如下:

现有数据:学生id、学生手机mac地址、时间戳、地点id

构想:通过学生mac地址某地点出现频次,构建频次矩阵,比如说现有六个地点,ABCDEF,某学生出现的频次分别为1、5、2、4、7、3,则[1,5,2,4,7,3]即为该学生在矩阵中的表现形式。(总的来说就是讲每个学生的出现频次规律抽象成一个向量,该向量由n个Term组成,每个Term都有一个权重,不同的频次根据学生在总矩阵中影响相关度的权重)

实现步骤:

1.数据预处理,建立空间向量模型,表现形式为:[[3,4,1,5,6,7],[6,4,5,5,2,1],......];

2.特征抽取完之后,对矩阵进行正则化处理。

3.计算余弦相似度。

7a254daea552?utm_campaign=maleskine&utm_content=note&utm_medium=seo_notes&utm_source=recommendation

image.png

分子:两个向量的点乘积

分母:两个向量的模的乘积

知识点:

1.利用python进行矩阵的正则化

正则化的过程是将每个样本缩放到单位范数(每个样本的范数为1),如果后面要使用如二次型(点积

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值