![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
傅孝龙
这个作者很懒,什么都没留下…
展开
-
电影推荐系统流程及分析
电影推荐系统流程及分析前言安装所需的第三方库MovieLens.pyRecommendationMetrics.pyEvaluatedAlgorithm.pyEvaluationData.pyEvaluator.pyContentBasedAlgorithm.pyUserBasedCF.pyUserBasedCFwithMetrics.pyItemBasedCF.pyItemBasedCFwithMetrics.pymatrixFactorization.pymatrixFactorixationSVDwi原创 2020-06-23 18:31:38 · 3521 阅读 · 1 评论 -
SparkALS.py
SparkALS.py这个python文件是关于spark的ALS推荐算法,Spark MLlib支持的ALS推荐算法式机器学习的协同过滤式推荐算法。机器学习的协同过滤式推荐算法通过观察所有用户给产品的评分来推断每个用户的喜好,并向用户推荐合适的产品。下面是这个python文件用到的第三方库,MovieLens是自己写的python文件,主要用到的第三方库是pyspark。from pyspark.sql import SparkSessionfrom pyspark.ml.evaluation原创 2020-06-22 22:45:01 · 220 阅读 · 0 评论 -
UITimateBakeOff.py
UITimateBakeOff.py这个python文件是结合了Content-based,User-Based,Item-Based,SVD,SVD++,Hybrid这几个算法的混合算法系统测试。下面是这个python文件使用的第三方库,但ContentBasedAlgorithm,Evaluator,HybridAlgorithm这三个库是自己写的python文件。from MovieLens import MovieLensfrom surprise import SVD, SVDppfro原创 2020-06-20 19:02:48 · 129 阅读 · 0 评论 -
UserBasedCF.py
UserBasedCF.py这个python文件是使用跑出基于用户协同过滤的模型并预测推荐电影。如下是这个python文件使用的第三方库from MovieLens import MovieLensfrom surprise import KNNBasicfrom collections import defaultdictfrom operator import itemgetterfrom time import time#创建一个MovieLens类ml = MovieLens()原创 2020-06-19 18:14:03 · 213 阅读 · 0 评论 -
UserBasedCFwithMetrics.py
UserBasedCFwithMetrics.pyUserBasedCFwithMetrics.py这个python文件是基于用户的相似度去预测推荐的电影。下面是这个python文件调用的第三方库。from surprise.model_selection import train_test_splitfrom surprise.model_selection import LeaveOneOutfrom surprise import KNNBaseline下面的代码是计算用户的相似度,然原创 2020-06-19 16:51:48 · 120 阅读 · 0 评论 -
Evaluator.py
Evaluator.py这个python文件调用的是前面写的那两个python文件EvaluatedAlgorithm和EvaluationData,所以就是再将这两个文件的功能整合一下。下面是调用这两个python文件的代码from EvaluatedAlgorithm import EvaluatedAlgorithmfrom EvaluationData import EvaluationDatainit函数EvaluationData类的返回值作为dataset。def __init原创 2020-06-18 11:31:40 · 742 阅读 · 0 评论 -
EvaluationData.py
EvaluationData.py这个python文件是用来评估数据的。这个python文件用到的第三方库如下:from surprise.model_selection import train_test_splitfrom surprise.model_selection import LeaveOneOutfrom surprise import KNNBaselineinit函数这个初始化函数输入参数为数据和最受欢迎的排名,使用KNNBasleine算法创建用于预测的训练和反测试集,原创 2020-06-17 22:37:21 · 288 阅读 · 0 评论 -
EvaluatedAlgorithm.py
EvaluatedAlgorithm.pyEvaluatedAlgorithm.py这个python文件是一个评估算法的文件。用到的第三方库如下:from RecommendationMetrics import RecommendationMetricsfrom surprise import AlgoBaseinit函数初始化函数,传入的参数为algorithm和namedef __init__(self,algorithm,name): self.algorithm=algo原创 2020-06-17 21:59:40 · 205 阅读 · 0 评论 -
RecommendationMetrics.py
RecommendationMetrics.pyRecommendationMetrics.pyMAE函数RMSE函数GetTopN函数HitRate函数AvergeReciprocalHitRank函数Diversity函数Novelty函数总结RecommendationMetrics.py这个python文件包含的函数为推荐指标函数涉及到以下第三方库from surprise import accuracyfrom collections import defaultdictimport原创 2020-06-17 11:21:30 · 330 阅读 · 0 评论 -
ContentBasedAlgorithm.py
ContentBasedAlgorithm.py(基于电影推荐电影的算法)ContentBasedAlgorithm.py(基于电影推荐电影的算法)init函数similarityBasedOnGenre函数similarityBasedOnYear函数fit函数estimate函数总结ContentBasedAlgorithm.py(基于电影推荐电影的算法)这个模块是基于内容计算相似度的模块,内容分为计算类型的相似度,计算年份的相似度,init函数初始化,k是指knn中的k值,默认值是40def原创 2020-06-16 23:44:08 · 259 阅读 · 0 评论