电影评分系统是一种常见的推荐系统。现在使用R语言基于协同过滤算法来构建一个电影评分预测模型。
一,前提准备
1.R语言包:ggplot2包(绘图),recommenderlab包,reshape包(数据处理)
2.获取数据:大家可以在明尼苏达州大学的社会化计算研究中心官网上面下载这些免费数据集,网站链接为http://grouplens.org/datasets/movielens/,也可以通过我的网盘下载https://yunpan.cn/Oc6R9apvCnVXGc 访问密码 e1af。这里包含了数据集和数据说明,该数据集是由943位用户对1682部电影的一个评分,每个评分值为1,2,3,4,5。关于数据信息,在数据说明里面有详细的说明,这里就不再赘述。
二,数据处理
首先加载我们所需要的包:
library(recommenderlab)
library(reshape)
library(ggplot2)
接下来我们就要读取数据,如果数据在当前的工作目录,那么我们就可以在下面的代码里面直接输入数据名称,即u.data。当数据不在当前工作目录下的时候,我们就可以通过输入路径来读取数据。
mydata<-read.table("E:/my blog