第1关:构建用户-酒店矩阵
import numpy as np
def create_user_hotel_matrix(users, items, data, hotel_id):
'''
构建用户-酒店矩阵
:param users: 用户数量,类型为整数
:param items: 酒店数量,类型为整数
:param data: 原始数据,类型为DataFrame
:param hotel_id: 酒店ID的列表,类型为列表
:return: user_hotel_matrix
'''
user_hotel_matrix = np.zeros((users, items))
for line in data.itertuples():
#********* Begin *********#
users = data.user_id.unique().shape[0]
# 将data中有多少个酒店统计出来并保存到items变量中
items = data.id.unique().shape[0]
user_hotel_matrix[line[3], hotel_id.index(line[1])] = line[4]
#********* End *********#
return user_hotel_matrix
data = pd.read_csv('./step1/hotel_data.csv', encoding='utf8')
第2关:酒店智能推荐
import numpy as np
def recommend_hotel(A, userid):
'''
向用户id为userid的用户推荐3家酒店
:param A: 已经更新好了的矩阵A
:param userid: 待推荐的userid,类型为整数
:return: recommend
'''
#********* Begin *********#
m,n = A.shape
d=5
alpha=0.1
lr=0.01
B = np.random.uniform(0,1,(m,d))
C = np.random.uniform(0,1,(d,n))
record = np.array(A>0, dtype=int)
B_grads = np.dot(np.multiply(record, np.dot(B,C)-A),C.T)
# 用和上面一样的方式按公式计算loss对C的偏导
C_grads = np.dot(B.T, np.multiply(record,np.dot(B,C)-A))
# 根据公式更新矩阵B和矩阵C
B = alpha*B - lr*B_grads
C = alpha*C - lr*C_grads
pred_ratings = np.dot(B, C)
# 对矩阵A中userid对应的行进行升序排序
ranklist = np.argsort(A[userid])
#********* End *********#
recommend = ranklist[-1:-4:-1]
return recommend[-1], recommend[-2], recommend[-3]