第1关:基于矩阵分解的协同过滤算法
# -*- coding: utf-8 -*-
import numpy as np
def recommend(userID,lr,alpha,d,n_iter,data):
'''
userID(int):1-10推荐用户ID
lr(float):学习率
alpha(float):权重衰减系数
d(int):矩阵分解因子(元素个数)
n_iter(int):训练轮数
data(ndarray):评分表
'''
#*********Begin*********#
#获取用户数与物品数
m,n = data.shape
#初始化喜好矩阵与内容矩阵,值为0-1之间,符合正态分布
x = np.random.uniform(0,1,(m,d))
w = np.random.uniform(0,1,(d,n))
#创建评分记录表,无评分记为0,有评分记为1
record = np.array(data>0,dtype=int)
#梯度下降,更新参数
for i in range(n_iter):
x_grads = np.dot(np.multiply(record,np.dot(x,w)-data),w.T)
w_grads = np.dot(x.T,np.multiply(record,np.dot(x,w)-data))
x = alpha*x - lr*x_grads
w = alpha*w - lr*w_grads
#预测
predict = np.dot(x,w)
#将用户未使用过的物品分值从低到高进行排列
for i in range(n):
if record[userID-1][i] == 1 :
predict[userID-1][i] = 0
recommend = np.argsort(predict[userID-1])
#*********End*********#
print('为用户%d,推荐的物品为:物品%d,物品%d'%(userID,recommend[-1]+1,recommend[-2]+1))
第2关:动手搭建电影推荐系统
# -*- coding: utf-8 -*-
import numpy as np
def build_rating(m,n,ratings_df):
'''
m(int):用户数
n(int):电影数
ratings_df(DataFrame):用户对电影评分记录表
rating(ndarray):用户-电影评分矩阵
'''
#*********Begin*********#
#创建电影评分矩阵
rating = np.zeros((m,n))
for index,row in ratings_df.iterrows():
rating[int(row['userId']),int(row['movieRow'])]=row['rating']
#*********End*********#
return rating
#训练模型
def fit(lr,alpha,d,n_iter,data):
'''
userID(int):推荐用户ID
lr(float):学习率
alpha(float):权重衰减系数
d(int):矩阵分解因子
n_iter(int):训练轮数
data(ndarray):用户-电影评分矩阵
'''
#*********Begin*********#
#获取用户数与电影数
m,n = data.shape
#初始化喜好矩阵与内容矩阵,值为0-1之间,符合正态分布
x = np.random.uniform(0,1,(m,d))
w = np.random.uniform(0,1,(d,n))
#创建评分记录表,无评分记为0,有评分记为1
record = np.array(data>0,dtype=int)
#梯度下降,更新参数
for i in range(n_iter):
x_grads = np.dot(np.multiply(record,np.dot(x,w)-data),w.T)
w_grads = np.dot(x.T,np.multiply(record,np.dot(x,w)-data))
x = alpha*x - lr*x_grads
w = alpha*w - lr*w_grads
#预测
predict = np.dot(x,w)
#*********End*********#
return predict
#进行推荐
def recommend(userID,predict,data):
'''
userID(int):推荐用户ID
predict(ndarray):预测结果
data(ndarray):用户-电影评分矩阵
'''
#*********Begin*********#
#将用户未看过的电影分值从低到高进行排列
n = predict.shape[1]
record = np.array(data>0,dtype=int)
for i in range(n):
if record[userID-1][i] == 1 :
predict[userID-1][i] = 0
recommend = np.argsort(predict[userID-1])
#*********End*********#
return recommend