背景:每个游客分别对七个景区进行了0-5的评分,并且共有十个游客,选取一组游客作为样本
注意事项:杰卡尔德相似度求交集的时候需要点对点求。
同时,要去除0分,防止干扰数据
import numpy as np
tour = np.array([[5, 5, 4, 1, 1, 5, 0], [4, 5, 1, 5, 3, 0, 5], [3, 1, 4, 4, 1, 3, 5],
[2, 0, 4, 1, 3, 2, 3],
[1, 4, 1, 5, 0, 2, 2], [5, 2, 4, 5, 3, 0, 4], [4, 1, 1, 4, 2, 5, 2], [5, 2, 5, 0, 4, 3, 5],
[2, 1, 4, 1, 4, 2, 0]])
tourist3 = [4, 0, 5, 0, 2, 2, 4]
#选取一个样本
jiaoji = []
for i in range(len(tour)):#第一个循环遍历二维数组第一层
A = tour[i]
fenmu = tourist3
retC = list(set(A).union(set(fenmu)))#求并集
retC.remove(0)#移除0分
fenmu = len(retC)
for s in range(len(A)):#第二个循环遍历出数组最里层的每一个元素
if A[s]==tourist3[s]:#点对点比较并求交集
jiaoji.append(A[s])
if 0 in jiaoji:
jiaoji.remove(0)#移除0分
if len(jiaoji) == 0:
print(0)
else:
fenzi = len(jiaoji)
print(fenzi/fenmu)
jiaoji = []#将这一轮的交集列表清零避免对后面的计算产生影响