推荐系统常用数据集整理
1. MovieLens
- dataset url: https://grouplens.org/datasets/movielens/
- 描述: 推荐系统领域非常非常经典的数据集。MovieLens (https://movielens.org/) 是一家收集用户(user)对电影(movie)的评分并根据海量评分数据为用户提供电影推荐服务的网站。MovieLens推荐数据集是一个系列数据集,包含MovieLens 100K, MovieLens 1M, MovieLens 10M, MovieLens 20M等多个数据集,100K, 1M, 10M, 20M分别表示数据集包含的评分的条数。
- Collaborative: user-movie评分关系,0.5分一档,最低为0.5分,最高为5分
- Content: movie的标题和类别,已经user对movie的标签化评价
2. CiteULike-a
- dataset url: https://github.com/js05212/citeulike-a
- 描述: CiteULike (http://www.citeulike.org/) 是一家提供在线文献管理服务的网站,用户(user)可以在线收藏和分享文献(paper).