matrixFactorixationSVDwithMetrics.py
这个.py文件是利用了SVD算法,也就是奇异值分解算法来对电影数据进行训练推荐。对于奇异值分解后期我会写一篇详细的博客来阐述。
下面是此文件的带注释代码,因为与其他算法采用类似结构就不做过多解释:
from MovieLens import MovieLens
from surprise import SVD
from Evaluator import Evaluator
import random
import numpy as np
from time import time
# 设置相同的随机数种子,评估函数中将会利用到
np.random.seed(0)
random.seed(0)
# 导入数据集
def LoadMovieLensData():
ml = MovieLens()
print('Loading movie ratings..')
data = ml.loadMovieLensDataset()
# 计算电影的受欢迎程度排名以衡量新颖性
rankings = ml.getPopularityRanks()
return ml, data, rankings
# 加载推荐算法的数据集
(ml, evaluationData, rankings) = LoadMovieLensData()
# 构建一个评估器以评估算法
evaluator = Evaluator(evaluationData, rankings)
# 构建SVD算法
SVD = SVD(n_epochs=14, lr_all=0.005, n_factors=5)
# 把SVD算法添加进评估器的算法池中
evaluator.AddAlgorithm(SVD, "SVD")
t0 = time()
# 评估SVD算法并打印所有评估指标
evaluator.Evaluate(True)
# 打印SVD的推荐结果
evaluator.SampleTopNRecs(ml)
tt = time() - t0
print("SVD Algorithm in %s seconds" % round(tt, 3))