Movielens Dataset:
其中Movielens-100k和movielens-1M有用户对电影的打分,电影的title、genre、IMDB链接、用户的gender、age、occupation、zip code。movielens-10M中还有用户对电影使用的tag信息。
HetRec2011 Dataset:包括了movielens-2k、delicious-2k和last.fm-2k。
在movielens-2k中,电影的信息更加丰富了,有IMDB和Rotten Tomatoes的信息,具体还有电影对应的genre、director、actor、发行的国家、拍摄的地点、tag信息,当然还有打分信息。
在delicious-2k中,是用户对bookmark(书签)的tag信息。具体包括用户之间的relation、书签的title和url、用户对书签使用的tag。这个数据集适用于tag的推荐。
在last.fm-2k中,是用户收听音乐的信息。具体包括双向的朋友关系、艺术家、用户收听艺术家信息(有weight)、用户对艺术家的tag信息、艺术家tag信息。
Wikilens Dataset
BookCrossing Dataset:用户对书的打分信息,用户城市、用户年龄、书在Amazon的信息及url。
Jest Joker Dataset
Eachmovie Dataset
(下图摘自论文Recommender System Survey)
Flixster Dataset:用户对电影的打分以及用户的friendship信息。 http://www.sfu.ca/~sja25/datasets/
Epinions Dataset: 包括用户trust关系、用户对item的打分信息、评论信息。 http://www.trustlet.org/wiki/Epinions_datasets
另外还有一些社交网络分析的数据集