我的个人博客
这个是python课的一个小案列,不涉及大数据推荐等等。
只是一个简单的集合应用
问题描述
假设已有大量用户对若干电影的评分数据,现有某用户,也看过一些电影并进行过评分,要求根据已有打分数据为该用户进行推荐。
基本思路
基本思路:用基于用户的协同过滤算法,也就是根据用户喜好来确定与当前用户最相似的用户,然后再根据最相似用户的喜好为当前用户进行推荐。本例采用字典来存放打分数据,格式为{用户1:{电影名称1:打分1, 电影名称2:打分2,…}, 用户2:{…}},首先在已有数据中查找与当前用户共同打分电影(使用集合的交集运算)数量最多的用户,如果有多个这样的用户就再从中选择打分最接近(打分的差距最小)的用户。代码中使用到了random模块中的randrange()函数,用来生成指定范围内的一个随机数。
效果图如下:
解法一
from random import randrange
# 历史电影打分数据,一共10个用户,每个用户对3到9个电影进行评分
# 每个电影的评分最低1分最高5分,这里是字典推导式和集合推导式的用法
data = {
'user' + str(i): {
'film' + str(randrange(1, 15)): randrange(1, 6)
for j in range(randrange(3, 10))}
for i in range(10)}
# 模拟当前用户打分数据,为5部随机电影打分
user = {
'film' + str(randrange(1, 15)): randrange(1, 6) for i in range(5)}
# 最相似的用户及其对电影打分情况
# 两个用户共同打分的电影最多
# 并且所有电影打分差值的平方和最小
f = lambda item: (-len(item