基于人工智能的电影推荐系统

最新推荐文章于 2024-09-10 19:56:58 发布

嵌入式详谈

最新推荐文章于 2024-09-10 19:56:58 发布

阅读量1.1k

点赞数 17

文章标签：人工智能 python 机器学习

本文链接：https://blog.csdn.net/2401_84204806/article/details/141970144

版权

1. 引言

随着互联网的发展，用户在面对海量的电影资源时，往往难以选择符合自己口味的影片。基于人工智能的电影推荐系统可以根据用户的历史行为和偏好，为其提供个性化的电影推荐。本文将介绍如何构建一个基于人工智能的电影推荐系统，包括环境准备、系统设计及代码实现。

2. 项目背景

传统的电影推荐多依赖于人工编辑或简单的规则，难以满足用户多样化的需求。利用人工智能技术，特别是深度学习和协同过滤算法，可以根据用户的观影历史和评分数据，自动学习用户偏好，从而提供更加精准的电影推荐，提高用户满意度。

3. 环境准备

硬件要求

CPU：四核及以上
内存：16GB及以上
硬盘：至少50GB可用空间
GPU（可选）：NVIDIA GPU，支持CUDA，用于加速模型训练

软件安装与配置

关键技术

5. 代码示例

数据预处理

使用 MovieLens 100K Dataset 作为示例数据集。

操作系统：Ubuntu 20.04 LTS 或 Windows 10
Python：建议使用 Python 3.8 或以上版本

Python 虚拟环境：

python3 -m venv movie_recommendation_env
source movie_recommendation_env/bin/activate  # Linux
.\movie_recommendation_env\Scripts\activate  # Windows

依赖安装：

pip install numpy pandas scikit-learn tensorflow keras

4. 系统设计

系统架构

系统主要包括以下模块：

数据预处理模块：对用户和电影数据进行清洗、编码和划分。
模型训练模块：基于深度学习的推荐模型，学习用户和电影的特征向量。
模型预测模块：根据训练好的模型，为用户生成电影推荐列表。
协同过滤：利用用户-物品交互矩阵，挖掘用户偏好，分为基于用户和基于物品的协同过滤。
矩阵分解：将用户-物品评分矩阵分解为用户和物品的潜在特征向量的乘积。
神经网络：使用深度学习模型（如神经协同过滤、AutoEncoder）提升推荐效果。

import pandas as pd
from sklearn.model_selection import train_test_split

# 加载数据
ratings = pd.read_csv('ml-100k/u.data', sep='\t', names=['user_id', 'item_id', 'rating', 'timestamp'])
users = pd.read_csv('ml-100k/u.user', sep='|', names=['user_id', 'age', 'gender', 'occupation', 'zip_code'])
items = pd.read_csv('ml-100k/u.item', sep='|', encoding='latin-1', header=None)

# 数据合并
data = pd.merge(ratings, users, on='user_id')
data = pd.merge(data, items[[0, 1]], left_on='item_id', right_on=0)
data.rename(columns={1: 'movie_title'}, inplace=True)

# 选取需要的列
data = data[['user_id', 'item_id', 'rating']]

# 划分训练集和测试集
train_data, test_data = train_test_split(data, test_size=0.2)

模型训练

使用 TensorFlow 构建一个基于矩阵分解的推荐模型。

import tensorflow as tf

num_users = data['user_id'].nunique()
num_items = data['item_id'].nunique()

# 构建模型
class RecommenderNet(tf.keras.Model):
    def __init__(self, num_users, num_items, embedding_size=50):
        super(RecommenderNet, self).__init__()
        self.user_embedding = tf.keras.layers.Embedding(num_users + 1, embedding_size)
        self.item_embedding = tf.keras.layers.Embedding(num_items + 1, embedding_size)
        self.dot = tf.keras.layers.Dot(axes=1)
    
    def call(self, inputs):
        user_vector = self.user_embedding(inputs[:, 0])
        item_vector = self.item_embedding(inputs[:, 1])
        dot_user_item = self.dot([user_vector, item_vector])
        return dot_user_item

# 准备训练数据
train_user = train_data['user_id'].values - 1  # 索引从0开始
train_item = train_data['item_id'].values - 1
train_rating = train_data['rating'].values

train_inputs = tf.stack([train_user, train_item], axis=1)

# 构建和编译模型
model = RecommenderNet(num_users, num_items)
model.compile(optimizer='adam', loss='mean_squared_error')

# 训练模型
model.fit(train_inputs, train_rating, epochs=5, batch_size=64)

模型预测

为指定用户推荐电影。

# 获取所有的电影ID
item_ids = data['item_id'].unique()

# 为某个用户推荐电影
def recommend_movies(user_id, num_recommendations=10):
    user_id_index = user_id - 1  # 索引从0开始
    user_vector = tf.expand_dims([user_id_index], axis=0)
    item_vector = tf.expand_dims(item_ids - 1, axis=1)

    user_item_pairs = tf.concat(
        [tf.repeat(user_vector, repeats=len(item_ids), axis=0), item_vector], axis=1
    )

    predictions = model.predict(user_item_pairs)
    predictions = tf.squeeze(predictions, axis=1)

    # 获取该用户未评分的电影
    rated_items = data[data['user_id'] == user_id]['item_id'].values
    unrated_items = [item for item in item_ids if item not in rated_items]

    # 筛选未评分电影的预测评分
    unrated_items_index = [item - 1 for item in unrated_items]
    unrated_predictions = predictions.numpy()[unrated_items_index]

    # 获取最高评分的电影
    top_indices = unrated_predictions.argsort()[-num_recommendations:][::-1]
    recommended_item_ids = [unrated_items[i] for i in top_indices]

    # 输出推荐的电影标题
    recommended_movies = items[items[0].isin(recommended_item_ids)][1]
    print(f"为用户 {user_id} 推荐的电影：")
    for title in recommended_movies.values:
        print(title)

# 示例：为用户ID为5的用户推荐电影
recommend_movies(user_id=5)