基于用户的协同过滤

通过用户对物品的喜爱程度进行度量和打分。根据不同用户对相同商品或内容的态度进行商品推荐。

举例说明,每个行向量表示某个用户对所有电影的评分 

 

先把数据中心化

 

然后计算用户 A 和其他用户的 Pearson 相关系数:

可以发现用户 A 和用户 B 喜好接近,因此可以将 B 喜欢但 A 没看过的密室推荐给 A,同时也可以将 A 喜欢但 B 没看过的火焰杯推荐给 B。

 

用户法存在的问题:

  1. 数据稀疏性。物品太多,不同用户之间买的物品重叠性较低,导致无法找到一个偏好相似的用户

  2. 算法扩展性。最近邻算法的计算量随着用户和物品数量的增加而增加,不适合数据量大的情况使用。

用户协同过滤算法是一种常见的推荐算法,它通过分析用户之间的相似性,来给用户推荐相似用户喜欢的物品。具体实现方式是,首先根据用户之间的历史行为数据(如购买记录、评分记录等),计算用户之间的相似度,然后利用相似用户的历史行为数据,推荐给目标用户他们喜欢的物品。 下面是一个简单的基于用户协同过滤算法的Python代码: ```python import numpy as np # 历史行为数据 data = np.array([ [5, 3, 0, 1, 4], [1, 0, 0, 5, 1], [4, 3, 0, 0, 5], [0, 1, 5, 4, 4], [5, 4, 4, 0, 0] ]) # 计算用户相似度 def similarity(user1, user2): return np.dot(user1, user2) / (np.linalg.norm(user1) * np.linalg.norm(user2)) # 给定目标用户id,计算推荐物品列表 def recommend(target_id): target_user = data[target_id] similarities = [] for i in range(len(data)): if i != target_id: sim = similarity(target_user, data[i]) similarities.append((i, sim)) similarities.sort(key=lambda x: x, reverse=True) top_similarities = similarities[:2] recommended_items = [] for item_id in range(len(target_user)): if target_user[item_id] == 0: score = 0 count = 0 for sim_id, sim_score in top_similarities: if data[sim_id][item_id] != 0: score += sim_score * data[sim_id][item_id] count += sim_score if count > 0: recommended_items.append((item_id, score/count)) recommended_items.sort(key=lambda x: x, reverse=True) return recommended_items # 测试代码 print(recommend(0)) # 给id为0的用户推荐物品 ``` 代码中的`data`是历史行为数据矩阵,其中每一行表示一个用户对各个物品的行为数据,0表示未有行为。`similarity`函数用于计算两个用户之间的相似度,这里采用的是余弦相似度计算方法。`recommend`函数则是用于给定目标用户id,计算出推荐的物品列表。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值