Python实战开发及案例分析（19）—— 推荐算法

最新推荐文章于 2025-03-14 23:50:58 发布

贾贾乾杯

最新推荐文章于 2025-03-14 23:50:58 发布

阅读量3.9k

点赞数 25

分类专栏： python实战开发及案例分析文章标签：推荐算法算法机器学习数据结构开发语言 python 随机森林

本文链接：https://blog.csdn.net/qq_42912425/article/details/138750588

版权

推荐系统是一种信息过滤系统，它的目标是预测用户对物品的偏好程度。在Python中，我们可以使用多种技术来实现推荐算法，包括基于内容的推荐、协同过滤推荐以及利用机器学习模型的混合推荐系统。

基本类型的推荐系统

基于内容的推荐系统：这种推荐系统基于对用户以前喜欢的物品的内容分析，推荐相似内容的物品。
协同过滤推荐系统：最常见的推荐算法类型，可以细分为用户基和物品基协同过滤。
- 用户基协同过滤：找到相似的用户，并基于他们的喜好推荐物品。
- 物品基协同过滤：推荐那些与用户历史上喜欢的物品相似的物品。

实现一个简单的物品基协同过滤推荐系统

我们将使用scikit-learn的cosine_similarity来计算物品之间的相似性，并根据这些相似性得分进行推荐。

准备数据

这里我们使用一个简单的电影评分数据集来演示。

import numpy as np
import pandas as pd
from sklearn.metrics.pairwise import cosine_similarity

# 假设我们有以下数据：用户对电影的评分
data = {
    'User': ['Alice', 'Bob', 'Cindy', 'Dan', 'Eva'],
    'Matrix': [5, 3, None, 1, None],
    'Titanic': [1, 2, 5, 2, 5],
    'Die Hard': [None, 5, 1, 5, None],
    'Forrest Gump': [2, 4, 2, None, 3],
    'Wall-E': [None, None, None, 5, 4]
}

df = pd.DataFrame(data).set_index('User')
df.fillna(0, inplace=True)  # 用0填充缺失值

计算物品之间的相似性

# 计算物品之间的余弦相似度
item_similarity = cosine_similarity(df.T)
similarity_df = pd.DataFrame(item_similarity, index=df.columns, columns=df.columns)

print("Item Similarity Matrix:")
print(similarity_df)

生成推荐

def recommend_movies(similarity, movie_name, user_rating):
    scores = similarity[movie_name] * (user_rating - 2.5)  # 将评分调整，考虑用户评分
    scores = scores.sort_values(ascending=False)
    return scores

print("Recommendations for Alice if she rated 'Titanic' 5 stars:")
print(recommend_movies(similarity_df, 'Titanic', 5))