利用surprise实现基于协同过滤的简单推荐系统

一.背景

surprise(Simple Python Recommendation System Engine)作为scikit系列中经典的算法包,实现了推荐系统的简单框架。其中自带的算法包括baseline、协同过滤、SVD和NMF等,接口非常简单,上手也很容易。由于关于各种基于机器学习的推荐方法在很多博客中都有详细的讲解,本文侧重于工程实现

二.代码实战
1. 相关包和数据集
# 基于surprise协同过滤 实现简单的top-n推荐系统
# 数据集采用surprise自带的MovieLens,或者也可下载到本地

from surprise import KNNBasic
from surprise import Dataset, Reader
from surprise.model_selection import train_test_split

# file_path 保存用户对电影的评分  格式为 用户|电影|评分|时间戳
file_path = '/Users/byron/.surprise_data/ml-100k/ml-100k/u.data'
reader = Reader(line_format='user item rating timestamp', sep='\t')
movie_data = Dataset.load_from_file(file_path=file_path, reader=reader)

train, test = train_test_split(movie_data, test_size=.2, random_state=1)

# 电影的相关信息 格式为 id|电影名称|发布日期|网站等信息
’‘’
['1682', 'Scream of Stone (Schrei aus Stein) (1991)', '08-Mar-1996', '', 'http://us.imdb.com/M/title-exact?Schrei%20aus%20Stein%20(1991)', '0', '0', '0', '0', '0', '0', '0', '0', '1', '0', '0', '0', '0', '0', '0', '0', '0', '0', '0\n']
‘’‘
item_file_path = '/Users/byron/.surprise_data/ml-100k/ml-100k/u.item'
id2name = {
   }
with open(item_file_path, 'r', encoding='ISO-8859-1') as f: # 这里注意解码方式
  for line in f:
    line = line.split('|')
    id2name[line[0]] = line[1]
2. 定义协同过滤方式并训练
# 定义协同过滤方式  user_based:False 时为基于item
sim_options = {
   'name': 'pearson_baseline', 'user_based': False}
algo = KNNBasic(sim_options=sim_options)
algo.fit(train)
3. 取出前k个邻居和对应的相似度
def get_k_nearest(inner_id, k_nearest):
  '''
  :return: 返回最近的k个邻居
  '''
  
  if algo.sim_options['user_based']: # 判断基于item还是user
    	all_instances = algo.trainset.all_users
  else:
      all_instances = algo.trainset.all_items
	# item或者user之间的相似度信息保存在algo的sim属性中  sim[i][j]表示个体和j之间的相似度
  others = [(x, algo.sim[inner_id][x]) for x in all_instances() if x != inner_id]
  # 根据相似度进行从高到低排列
  sorted_others = sorted(others, key=lambda x: x[1], reverse=True)
  # 取出前k个邻居
  return sorted_others[:k_nearest]
4. 进行推荐
def recommend(id, k_nearest, n_items, user_based=False):
    '''
    default adapt item-based CF
    :param id: original user id
    :param k_nearest:
    :param n_items: top_n recommended finally
    :param user_based: item-based or user-based
    :return: top_n items liked by user most likely
    '''
    # 基于用户的推荐
    if user_based:
        recommend_dict = {
   }
        inner_id = algo.trainset.to_inner_uid(ruid=id) # 将原始用户id转化为inner_id
        # 取得当前用户已经评分的电影item
        cur_user_like_and_rating = algo.tra
  • 3
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 基于协同过滤的图书推荐系统利用用户之间的相似性来推荐图书的一种方法。该系统首先收集用户的图书评分数据,然后计算用户之间的相似度。相似度可以使用余弦相似度、皮尔逊相关系数等方法来计算。接下来,系统根据用户相似度找到相似用户,并将这些相似用户喜欢的图书推荐给目标用户。 在Python中实现基于协同过滤的图书推荐系统的步骤如下: 1. 收集用户的图书评分数据,可以使用数据库或文件来存储数据。 2. 对评分数据进行预处理,如去除异常值、填充缺失值等。 3. 计算用户之间的相似度,可以选择合适的相似度计算方法。 4. 根据相似度找到相似的用户集合。 5. 基于相似用户的喜好,给目标用户推荐图书。 6. 评估推荐性能,可以使用准确率、召回率等指标来评估推荐系统的性能。 7. 不断改进推荐算法,如引入隐语义模型、深度学习等方法来提升推荐效果。 在实现过程中,可以使用Python库如pandas来处理数据、numpy来进行相似度计算等。此外,还可以使用推荐系统领域的库如surprise来简化开发过程。 通过基于协同过滤的图书推荐系统,用户可以根据自己的兴趣爱好得到个性化的图书推荐,提高用户满意度,并且通过分析用户的喜好,可以精准地向用户推荐更多相关图书,为用户提供更好的阅读体验。 ### 回答2: 基于协同过滤的图书推荐系统是一种利用用户行为数据和图书的相关性来推荐用户可能感兴趣的图书的方法。Python是一种流行的编程语言,可以用来开发这样的推荐系统。 首先,我们需要收集用户对图书的评价数据。可以通过用户登录系统并评分已阅读的图书,或者利用已有的用户评分数据来构建用户-图书评分矩阵。 接下来,我们可以利用协同过滤算法来计算用户之间或图书之间的相似度。以用户为例,可以使用余弦相似度或皮尔逊相关系数等方法来衡量用户之间的相似度。对于图书之间的相似度,可以根据用户的评分数据来计算,例如通过计算两本书的评分向量的相似度。 然后,我们根据用户的兴趣和相似用户或相似图书的评分数据,来为用户推荐可能感兴趣的图书。可以使用基于用户的协同过滤方法,找到与目标用户最相似的其他用户,并将这些相似用户喜欢的图书推荐给目标用户。另一种方法是基于图书的协同过滤,找到与目标图书最相似的其他图书,然后将这些相似图书推荐给目标用户。 最后,我们可以通过评估推荐系统的性能来不断改进。可以使用交叉验证等方法来计算推荐结果的准确度和召回率,并根据评估结果来调整算法或优化模型。 总结而言,基于协同过滤的图书推荐系统使用用户行为数据和图书的相似性来为用户推荐可能感兴趣的图书。Python作为一种流行的编程语言,可以用来实现这个推荐系统,并根据用户的兴趣不断提供更好的推荐结果。 ### 回答3: 基于协同过滤的图书推荐系统利用用户对图书的评分或者行为数据来预测用户对其他图书的喜好程度,从而向用户推荐相似的图书。Python是一种流行的编程语言,具有丰富的数据处理和机器学习库,非常适用于实现基于协同过滤的图书推荐系统。 在Python中,可以使用pandas库来加载和处理图书评分数据。可以将数据转化为用户-图书的评分矩阵,使用该矩阵来计算用户之间的相似度。可以使用scikit-learn库中的cosine_similarity来计算用户之间的相似度,也可以使用其他的相似度度量方法。 接下来,根据用户之间的相似度和他们的评分情况,可以为每个用户生成推荐列表。可以选取与用户最相似的K个用户,将这些用户对其他图书的评分加权平均作为对用户的推荐,从而为该用户推荐与他们相似的图书。 最后,可以使用Python的可视化库,如matplotlib或seaborn来展示推荐结果。可以将推荐的图书显示在用户的个人主页中,或者通过邮件、推送等方式将推荐结果发送给用户。 总结来说,基于协同过滤的图书推荐系统是通过分析用户对图书的评分数据,计算用户之间的相似度,并根据相似度为用户生成推荐列表。Python作为一种流行的编程语言,提供了丰富的数据处理和机器学习库,非常适用于实现这样的推荐系统
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值