注:
1. 数据集来源MovieLens
2. 源代码在末尾附上
一、Introduction
无论是在实体商店还是在网络上,都会有Top-N推荐的情况。基于客户或者基于商品做出推荐。本实验基于Movielens的电影数据集,对电影做出Top-N 推荐。主要目的是基于Item-Based的思想来进行Top-10的相关电影推荐。
二、Methodology
本实验基于Item-Based 的思路,计算电影的相似度,对每部电影都生成一个它与其他电影的相似度的序列(按顺序排列),然后从中得到Top-10的电影来作为该部电影的相关推荐电影集。在MovieLens中的数据格式如下:
1::Toy Story (1995)::Animation|Children's|Comedy
1:表示电影ID; Toy Story(1995)表示电影名 ;Animation|Children’s|Comedy :表示标签
因此可以用一个向量表来表示该电影的信息:
附注: 0 表示电影没有该标签 , 1 表示电影有该标签
对每一部电影,计算它与其他电影的相似度,生成一个相似度的有序序列。N部电影生成N个有序序列,因此对每一部电影都有一个单