HybridWithMetrics.py
这个.py文件主要是调用HybridAlgorithm类对两个预测算法进行分别融合,然后再将这三个算法进行评估,最后将algorithm算法集中每个算法推荐指标进行统计分数,然后排序给出推荐电影并打印出来。
from MovieLens import MovieLens
from ContentBasedAlgorithm import ContentBasedAlgorithm
from HybridAlgorithm import HybridAlgorithm
from Evaluator import Evaluator
from surprise import NormalPredictor
from time import time
import random
import numpy as np
# 导入电影评价数据和电影受欢迎程度数据
def LoadMovieLensData():
ml = MovieLens()
print('Loading movie ratings..')
data = ml.loadMovieLensDataset()
# Compute movie popularity ranks to measure novelty
rankings = ml.getPopularityRanks()
return (ml, data, rankings)
np.random.seed(0)
random.seed(0)
# 加载数据集
(ml, evaluationData, rankings) = LoadMovieLensData()
# 调用之前写好的评估类,以便评估它们
evaluator = Evaluator(evaluationData, rankings)
# 对数据集进行随机预测
Random = NormalPredictor()
# 调用之前的电影推荐电影算法预测
ContentKNN = ContentBasedAlgorithm()
# 将random算法和ContentKNN算法进行平均加权
Hybrid = HybridAlgorithm([Random, ContentKNN], [0.5, 0.5])
# 评估开始时间
t0=time()
# 评估三个算法
evaluator.AddAlgorithm(Random, "Random")
evaluator.AddAlgorithm(ContentKNN, "ContentKNN")
evaluator.AddAlgorithm(Hybrid, "Hybrid")
# 调用评估函数只计算MAE和RMSE
evaluator.Evaluate(False)
# 将algorithm算法集中每个算法推荐指标进行统计分数,然后排序给出推荐电影并打印出来。
evaluator.SampleTopNRecs(ml)
# 计算总共耗时
tt=time()-t0
print("time to run %s secs" % round(tt,3))