chatgpt赋能python：基于Python的电影推荐系统：打造您的最佳娱乐伙伴-CSDN博客

本文链接：https://blog.csdn.net/suimodina/article/details/131486436

本文介绍了如何使用Python构建基于协同过滤的电影推荐系统，通过处理和清洗数据，使用SVD模型进行训练，为用户提供个性化的电影推荐。利用movielens数据集，文章展示了从数据准备到模型应用的完整流程，强调Python在电影推荐领域的应用。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

基于Python的电影推荐系统：打造您的最佳娱乐伙伴

电影一直是人们娱乐生活中不可或缺的一部分。但是，当面对数量庞大的电影库时，挑选和选择电影可能会变得十分困难。这时候，一款电影推荐系统可以帮助您轻松选择您想要的电影，从而提升您的娱乐体验。

基于Python的电影推荐系统是一种可以根据用户的历史观看记录和评分，为用户提供个性化电影推荐的系统。本文将带您深入了解如何使用Python来开发这样的系统，并以此来帮助您更好的了解电影推荐系统及其功能。

开始构建一个基于Python的电影推荐系统

要构建一个电影推荐系统，你需要准备2个数据源：电影数据和用户行为数据，并且导入一些必要的Python库。

在这里，我们将使用movielens数据集，其中包含100k个电影评分数据。您可以通过以下代码下载和解析数据集：

import urllib.request    
import zipfile

url = "http://files.grouplens.org/datasets/movielens/ml-100k.zip"

filename = "ml-100k.zip"

urllib.request.urlretrieve(url, filename)

with zipfile.ZipFile("ml-100k.zip","r") as zip_ref:
    zip_ref.extractall()

在数据集中，电影信息存储在u.item文件中，用户行为数据存储在u.data文件中。这两个文件都是以tab分割的文本文件。

电影信息的示例：

1|Toy Story (1995)|01-Jan-1995||http://us.imdb.com/M/title-exact?Toy%20Story%20(1995)|0|0|0|1|1|0|0|0|0|0|0|0|0|0|0|1|0|0|0|0|0|0|0|0|0|0|0|0|0|0

其中包含电影ID，电影标题，上映日期，IMDB链接和一个包含电影类型的字符串。

用户行为数据的示例：

196	242	3	881250949
186	302	3	891717742
22	377	1	878887116
244	51	2	880606923
166	346	1	886397596
298	474	4	884182806
115	265	2	881171488
...

每个条目包含用户ID，电影ID，评分和时间戳。

开发基于Python的推荐系统

数据准备

在使用Python构建电影推荐系统之前，我们需要对数据进行处理和清洗。数据需要转换为Pandas DataFrame，并将其合并为一个DataFrame以进行分析。

import pandas as pd

ratings = pd.read_csv("u.data", sep="\t", header=None, 
                      names=["user_id", "movie_id", "rating", "timestamp"])

movies = pd.read_csv("u.item", sep="|", header=None, usecols=[0,1],
                     names=["movie_id", "title"])

movie_ratings = pd.merge(movies, ratings)

创建和训练模型

借助Python库，我们可以使用基于协同过滤的推荐算法来训练我们的模型。我们将使用SVD模型进行推荐计算。

from surprise import Dataset, Reader
from surprise.model_selection import train_test_split
from surprise import SVD

# 定义读取器
reader = Reader(rating_scale=(1, 5))

# 使用pandas dataframe创建surprise dataset
data = Dataset.load_from_df(movie_ratings[["user_id", "movie_id", "rating"]], reader)

# 切分数据集（80%训练集，20%测试集）
trainset, testset = train_test_split(data, test_size=0.2)

# 定义模型并训练
model = SVD()
model.fit(trainset)

基于模型进行推荐

当我们有了一个训练好的模型之后，我们就可以使用它来为用户生成推荐结果。任何一个指定用户的电影推荐都可以基于模型计算得到。

from collections import defaultdict

# 创建默认字典用于计数
def get_top_n(predictions, n=10):
    top_n = defaultdict(list)

    # 将预测结果按用户分组
    for uid, iid, true_r, est, _ in predictions:
        top_n[uid].append((iid, est))

    # 对每个用户的预测结果进行排序
    for uid, user_ratings in top_n.items():
        user_ratings.sort(key=lambda x: x[1], reverse=True)
        top_n[uid] = user_ratings[:n]

    return top_n

# 进行预测
test_predictions = model.test(testset)

# 获取前10个电影推荐内容
top_n = get_top_n(test_predictions, n=10)

# 打印电影推荐结果
for uid, user_ratings in top_n.items():
    print("User {}".format(uid))
    for (iid, _) in user_ratings:
        print("  {}".format(movies.loc[movies["movie_id"] == iid]["title"].values[0]))

结论

在本文中，我们介绍了如何基于Python构建一个简单的电影推荐系统。使用movielens的数据集，我们首先将数据集转换为pandas dataframe，然后使用surprise库中的SVD模型进行模型训练和预测。最后，我们通过访问推荐结果的top-n来为用户生成个性化的电影推荐。

Python越来越流行，基于Python的应用逐渐得到更广泛的应用，电影推荐系统也不例外。如果你对这个有着较深兴趣的话，只需要导入适当的库和数据集，就可以 access推荐系统，解决你日常生活的电影选择烦恼。

最后的最后

本文由chatgpt生成，文章没有在chatgpt生成的基础上进行任何的修改。以上只是chatgpt能力的冰山一角。作为通用的Aigc大模型，只是展现它原本的实力。

对于颠覆工作方式的ChatGPT，应该选择拥抱而不是抗拒，未来属于“会用”AI的人。

🧡AI职场汇报智能办公文案写作效率提升教程 🧡 专注于AI+职场+办公方向。
下图是课程的整体大纲

下图是AI职场汇报智能办公文案写作效率提升教程中用到的ai工具

🚀 优质教程分享 🚀

🎄可以学习更多的关于人工只能/Python的相关内容哦！直接点击下面颜色字体就可以跳转啦！

学习路线指引（点击解锁）	知识定位	人群定位
🧡 AI职场汇报智能办公文案写作效率提升教程 🧡	进阶级	本课程是AI+职场+办公的完美结合，通过ChatGPT文本创作，一键生成办公文案，结合AI智能写作，轻松搞定多场景文案写作。智能美化PPT,用AI为职场汇报加速。AI神器联动，十倍提升视频创作效率
💛Python量化交易实战 💛	入门级	手把手带你打造一个易扩展、更安全、效率更高的量化交易系统
🧡 Python实战微信订餐小程序 🧡	进阶级	本课程是python flask+微信小程序的完美结合，从项目搭建到腾讯云部署上线，打造一个全栈订餐系统。