python程序设计实验报告:
一.电影打分与推荐
1.实验名称:
电影打分与推荐
2.实验目的:
1、理解基于用户的协同过滤算法原理。
2、熟练运用字典和集合。
3、熟练运用内置函数 sum()、min()、len()。
3.实验原理:
编写程序,生成数据模拟(也可以使用真实数据)多人对多个电影的打分(1-5 分),然后根据这些数据对某用户 A 进行推荐。推荐规则为:在已有数据中选择与该用户 A 的爱好最相似的用户 B,然后从最相似的用户 B 已看过但用户 A 还没看过的电影中选择用户 B 打分最高的电影推荐给用户 A。相似度的计算标准为:1)两个用户共同打分过的电影越多,越相似;2)两个用户对共同打分的电影的打分越接近,越相似。
4.仪器与材料:
PC机,pycharm。
5.实验步骤(代码):
from random import randrange
def generate_movie_ratings(num_users, num_movies):
"""生成随机的用户电影评分数据"""
return {'user' + str(i): {'film' + str(randrange(1, 15)): randrange(1, 6)
for _ in range(randrange(3, 10))}
for i in range(num_users)}
def generate_user_ratings(num_movies):
"""生成随机的当前用户电影评分数据"""
return {'film' + str(randrange(1, 15)): randrange(1, 6) for _ in range(num_movies)}
def calculate_similarity(user1, user2):
"""计算两个用户的相似度,返回共同电影数量和打分差值的平方和"""
common_movies = user1.keys() & user2.keys()
squared_diff_sum = sum((user1[film] - user2[film]) ** 2 for film in common_movies)
return -len(common_movies), squared_diff_sum
def find_most_similar_user(user, data):
"""查找与当前用户最相似的用户"""
return min(data.items(), key=lambda item: calculate_similarity(item[1], user))
def recommend_movie(user, similar_user):
"""在当前用户没看过的电影中选择打分最高的进行推荐"""
unrated_movies = similar_user.keys() - user.keys()
return max(unrated_movies, key=lambda film: similar_user[film])
# 模拟数据
data = generate_movie_ratings(10, 15)
user = generate_user_ratings(5)
# 查找最相似用户
similar_user, similar_user_ratings = find_most_similar_user(user, data)
# 输出结果
print('Known Data'.center(50, '='))
for user_id, user_ratings in data.items():
similarity, squared_diff_sum = calculate_similarity(user_ratings, user)
print(f"{len(user_ratings.keys() & user.keys())}:{squared_diff_sum}", (user_id, user_ratings))
print('Current User'.center(50, '='))
print(user)
print('Most Similar User and His Films'.center(50, '='))
print(similar_user, similar_user_ratings)
print('Recommended Film'.center(50, '='))
recommended_film = recommend_movie(user, similar_user_ratings)
print(recommended_film)
6.问题即讨论
使用列表解析和内置函数: 通过使用列表解析和内置函数,可以使代码更简洁。
可读性改进: 使用更有描述性的变量名和注释,以提高代码可读性。
函数封装: 将相似用户查找和推荐电影的逻辑封装到函数中,以提高代码的模块化和可维护性。