python+协同过滤算法实现简单的图书推荐系统

背景介绍

当我们做一些推荐系统网站时,通常需要合适的推荐算法,下面给大家介绍推荐系统中经典的推荐算法——协同过滤算法。在本文中通过Python语言,以一个图书推荐系统为案例,最终实现一个基于用户对图书的评分而对指定的用户个性化推荐的网站系统。(ps:本文中介绍的是算法的简单示例,如需项目功能扩展,可在最下方联系我

协同过滤算法

协同过滤是一种常用于推荐系统中的算法,用于预测用户可能感兴趣的物品或内容。它的核心思想是基于用户行为和相似性来进行预测,而不依赖于物品或用户的内容特征。协同过滤算法根据用户和物品之间的交互历史,发现用户之间的相似性或物品之间的相似性,从而为用户生成个性化的推荐列表。
协同过滤算法可以分为两种主要类型:基于用户的协同过滤和基于物品的协同过滤。

  1. 基于用户的协同过滤: 这种方法首先计算用户之间的相似性,然后利用与目标用户相似的其他用户的偏好来预测目标用户对物品的评分或喜好。基于用户的协同过滤通常包括以下步骤:
    • 相似性计算: 使用一些相似性度量(如余弦相似度、皮尔逊相关系数等)来计算用户之间的相似性。
    • 邻居选择: 选取与目标用户最相似的一些用户作为邻居。
    • 预测生成: 利用邻居用户对物品的评分来预测目标用户对尚未互动过的物品的评分。
  2. 基于物品的协同过滤: 这种方法通过计算物品之间的相似性来预测用户对尚未互动过的物品的评分或喜好。基于物品的协同过滤一般包括以下步骤:
    • 相似性计算: 计算物品之间的相似性,通常与用户的历史行为相关。
    • 邻居选择: 选取与目标物品最相似的一些物品作为邻居。
    • 预测生成: 基于目标用户对邻近物品的评分,预测用户对尚未互动过的物品的评分。

协同过滤算法的优点在于它能够捕捉用户和物品之间的复杂关系,从而提供个性化的推荐。然而,它也面临一些挑战,比如“冷启动”问题(新用户或新物品如何进行推荐)、数据稀疏性(用户和物品之间的交互数据可能非常少)、推荐偏差(可能会忽视一些长尾物品)等。

代码示例

在本文中通过使用Django框架作为网站开发的后端框架。其数据表模型结构如下:
image-20230827204556229

  • db_user_info:用户信息表
  • db_book:书籍表
  • db_rating:书籍评分表

在本文中通过使用基于用户的协同过滤算法,在计算相似度时选用余弦相似度计算公式。余弦相似度衡量两个向量之间的方向一致程度。在这里,向量是用户对共同评价过的图书的评分。余弦相似度计算公式为:
c o s i n e s i m i l a r i t y = ∑ i u s e r 1 _ s c o r e s [ i ] × u s e r 2 _ s c o r e s [ i ] ∑ i u s e r 1 _ s c o r e s [ i ] 2 × ∑ i u s e r 2 _ s c o r e s [ i ] 2 cosine_similarity = \frac{\sum_{i} user1\_scores[i] \times user2\_scores[i]}{\sqrt{\sum_{i} user1\_scores[i]^2} \times \sqrt{\sum_{i} user2\_scores[i]^2}} cosinesimilarity=iuser1_scores[i]2 ×iuser2_scores[i]2 iuser1_scores[i]×user2_scores[i]
代码如下:

def calculate_cosine_similarity(user_ratings1, user_ratings2):
    # 将用户1的图书评分存入字典,键为图书ID,值为评分
    book_ratings1 = {rating.book_id: rating.score for rating in user_ratings1}
    # 将用户2的图书评分存入字典,键为图书ID,值为评分
    book_ratings2 = {rating.book_id: rating.score for rating in user_ratings2}

    # 找出两个用户共同评价过的图书
    common_books = set(book_ratings1.keys()) & set(book_ratings2.keys())

    if len(common_books) == 0:
        return 0.0  # 无共同评价的图书,相似度为0

    # 提取共同评价图书的评分,存入NumPy数组
    user1_scores = np.array([book_ratings1[book_id] for book_id in common_books])
    user2_scores = np.array([book_ratings2[book_id] for book_id in common_books])

    # 计算余弦相似度
    cosine_similarity = np.dot(user1_scores, user2_scores) / (
            np.linalg.norm(user1_scores) * np.linalg.norm(user2_scores))
    return cosine_similarity

其中,user1_scores 和 user2_scores 是两个用户的评分向量,i 是共同评价过的图书的索引。实现步骤如下:

首先遍历所用其他的用户,对于每个其他用户计算与目标用户的余弦相似度。如果相似度大于0,那么遍历其他用户评价的图书,创建推荐记录包括加权评分和相似度。然后按照分数大小降序排列。将对应的图书名称信息等返回给用户。

实验效果

在这里插入图片描述
Python网站开发、项目订制、请扫下方名片

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 基于协同过滤图书推荐系统是利用用户之间的相似性来推荐图书的一种方法。该系统首先收集用户的图书评分数据,然后计算用户之间的相似度。相似度可以使用余弦相似度、皮尔逊相关系数等方法来计算。接下来,系统根据用户相似度找到相似用户,并将这些相似用户喜欢的图书推荐给目标用户。 在Python实现基于协同过滤图书推荐系统的步骤如下: 1. 收集用户的图书评分数据,可以使用数据库或文件来存储数据。 2. 对评分数据进行预处理,如去除异常值、填充缺失值等。 3. 计算用户之间的相似度,可以选择合适的相似度计算方法。 4. 根据相似度找到相似的用户集合。 5. 基于相似用户的喜好,给目标用户推荐图书。 6. 评估推荐性能,可以使用准确率、召回率等指标来评估推荐系统的性能。 7. 不断改进推荐算法,如引入隐语义模型、深度学习等方法来提升推荐效果。 在实现过程中,可以使用Python库如pandas来处理数据、numpy来进行相似度计算等。此外,还可以使用推荐系统领域的库如surprise来简化开发过程。 通过基于协同过滤图书推荐系统,用户可以根据自己的兴趣爱好得到个性化的图书推荐,提高用户满意度,并且通过分析用户的喜好,可以精准地向用户推荐更多相关图书,为用户提供更好的阅读体验。 ### 回答2: 基于协同过滤图书推荐系统是一种利用用户行为数据和图书的相关性来推荐用户可能感兴趣的图书的方法。Python是一种流行的编程语言,可以用来开发这样的推荐系统。 首先,我们需要收集用户对图书的评价数据。可以通过用户登录系统并评分已阅读的图书,或者利用已有的用户评分数据来构建用户-图书评分矩阵。 接下来,我们可以利用协同过滤算法来计算用户之间或图书之间的相似度。以用户为例,可以使用余弦相似度或皮尔逊相关系数等方法来衡量用户之间的相似度。对于图书之间的相似度,可以根据用户的评分数据来计算,例如通过计算两本书的评分向量的相似度。 然后,我们根据用户的兴趣和相似用户或相似图书的评分数据,来为用户推荐可能感兴趣的图书。可以使用基于用户的协同过滤方法,找到与目标用户最相似的其他用户,并将这些相似用户喜欢的图书推荐给目标用户。另一种方法是基于图书协同过滤,找到与目标图书最相似的其他图书,然后将这些相似图书推荐给目标用户。 最后,我们可以通过评估推荐系统的性能来不断改进。可以使用交叉验证等方法来计算推荐结果的准确度和召回率,并根据评估结果来调整算法或优化模型。 总结而言,基于协同过滤图书推荐系统使用用户行为数据和图书的相似性来为用户推荐可能感兴趣的图书Python作为一种流行的编程语言,可以用来实现这个推荐系统,并根据用户的兴趣不断提供更好的推荐结果。 ### 回答3: 基于协同过滤图书推荐系统是利用用户对图书的评分或者行为数据来预测用户对其他图书的喜好程度,从而向用户推荐相似的图书Python是一种流行的编程语言,具有丰富的数据处理和机器学习库,非常适用于实现基于协同过滤图书推荐系统。 在Python中,可以使用pandas库来加载和处理图书评分数据。可以将数据转化为用户-图书的评分矩阵,使用该矩阵来计算用户之间的相似度。可以使用scikit-learn库中的cosine_similarity来计算用户之间的相似度,也可以使用其他的相似度度量方法。 接下来,根据用户之间的相似度和他们的评分情况,可以为每个用户生成推荐列表。可以选取与用户最相似的K个用户,将这些用户对其他图书的评分加权平均作为对用户的推荐,从而为该用户推荐与他们相似的图书。 最后,可以使用Python的可视化库,如matplotlib或seaborn来展示推荐结果。可以将推荐的图书显示在用户的个人主页中,或者通过邮件、推送等方式将推荐结果发送给用户。 总结来说,基于协同过滤图书推荐系统是通过分析用户对图书的评分数据,计算用户之间的相似度,并根据相似度为用户生成推荐列表。Python作为一种流行的编程语言,提供了丰富的数据处理和机器学习库,非常适用于实现这样的推荐系统

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值