- 博客(1)
- 资源 (10)
- 收藏
- 关注
原创 聚类算法:K-Means算法及其实现
K-means算法是很典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。该算法认为簇是由距离靠近的对象组成的,因此把得到紧凑且独立的簇作为最终目标。对于聚类问题,我们事先并不知道给定的一个训练数据集到底具有哪些类别(即没有指定类标签),而是根据需要设置指定个数类标签的数量(但不知道具体的类标签是什么),然后通过K-means算法将具有相同特征,或
2015-08-21 14:58:09 11944
中国计算机学会推荐国际刊物会议列表(数据库数据挖掘与内容检索)
2016-06-20
GroupLens_MovieLens数据集
数据集简介如下:(上传空间有限,这里我只传了一个最新的2016/1的数据集,如果有需要的话到官网下载吧http://grouplens.org/datasets/movielens/)
MovieLens 100K Dataset
Stable benchmark dataset. 100,000 ratings from 1000 users on 1700 movies. Released 4/1998.
MovieLens 1M Dataset
Stable benchmark dataset. 1 million ratings from 6000 users on 4000 movies. Released 2/2003.
MovieLens 10M Dataset
Stable benchmark dataset. 10 million ratings and 100,000 tag applications applied to 10,000 movies by 72,000 users. Released 1/2009.
MovieLens 20M Dataset
Stable benchmark dataset. 20 million ratings and 465,000 tag applications applied to 27,000 movies by 138,000 users. Released 4/2015.
MovieLens Latest Datasets
Small: 100,000 ratings and 6,100 tag applications applied to 10,000 movies by 700 users. Last updated 1/2016.
Full: 22,000,000 ratings and 580,000 tag applications applied to 33,000 movies by 240,000 users. Last updated 1/2016.
MovieLens Tag Genome Dataset
11 million computed tag-movie relevance scores from a pool of 1,100 tags applied to 10,000 movies.
2016-01-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人