概念理解:
推荐:在数据挖掘中,推荐包括相似推荐及系统过滤推荐。
1,相似推荐:指当用户表现出对某人或某物的兴趣是,为他推荐与之相类似的人,或者物,他的核心是,人以群分,物以类聚
2,协同过滤推荐:指利用已有用户群过去的行为和意见,预测当前用户最有可能喜欢那些东西。
余弦相似度:
求两者之间的夹角,得出对应的余弦值,该值可以用来表示两个向量的相似性,夹角越小,余弦值越大,方向更吻合,则越相似。
python中sklearn计算特征之间的距离
sklearn.metrics库中的pairsise_distances。
pairsise_distances(textvector,metric=’consin’)
案例代码:
import pandas,bumpy,codecs,os,jieba
from sklearn.metrics import pairwise_distances
# 创建语料库
co