2015年08月_行者小朱

10月 08月

原创聚类算法：K-Means算法及其实现

K-means算法是很典型的基于距离的聚类算法，采用距离作为相似性的评价指标，即认为两个对象的距离越近，其相似度就越大。该算法认为簇是由距离靠近的对象组成的，因此把得到紧凑且独立的簇作为最终目标。对于聚类问题，我们事先并不知道给定的一个训练数据集到底具有哪些类别（即没有指定类标签），而是根据需要设置指定个数类标签的数量（但不知道具体的类标签是什么），然后通过K-means算法将具有相同特征，或

2015-08-21 14:58:09 11944

中国计算机学会推荐国际刊物会议列表(数据库数据挖掘与内容检索)

2016-06-20

数据集简介如下：（上传空间有限，这里我只传了一个最新的2016/1的数据集，如果有需要的话到官网下载吧http://grouplens.org/datasets/movielens/） MovieLens 100K Dataset Stable benchmark dataset. 100,000 ratings from 1000 users on 1700 movies. Released 4/1998. MovieLens 1M Dataset Stable benchmark dataset. 1 million ratings from 6000 users on 4000 movies. Released 2/2003. MovieLens 10M Dataset Stable benchmark dataset. 10 million ratings and 100,000 tag applications applied to 10,000 movies by 72,000 users. Released 1/2009. MovieLens 20M Dataset Stable benchmark dataset. 20 million ratings and 465,000 tag applications applied to 27,000 movies by 138,000 users. Released 4/2015. MovieLens Latest Datasets Small: 100,000 ratings and 6,100 tag applications applied to 10,000 movies by 700 users. Last updated 1/2016. Full: 22,000,000 ratings and 580,000 tag applications applied to 33,000 movies by 240,000 users. Last updated 1/2016. MovieLens Tag Genome Dataset 11 million computed tag-movie relevance scores from a pool of 1,100 tags applied to 10,000 movies.

2016-01-14

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

行者小朱的博客

原创聚类算法：K-Means算法及其实现

计算机网络第五版

Redis设计与实现

Java_TCPIP_Socket编程

中国计算机学会推荐国际刊物会议列表(数据库数据挖掘与内容检索)

GroupLens_MovieLens数据集

Spark学习资料

Hadoop平台搭建步骤

spring in action 中文版后五章

Visual C++

空空如也

原创 聚类算法：K-Means算法及其实现

计算机网络第五版

Redis设计与实现

Java_TCPIP_Socket编程

中国计算机学会推荐国际刊物会议列表(数据库数据挖掘与内容检索)

GroupLens_MovieLens数据集

Spark学习资料

Hadoop平台搭建步骤

spring in action 中文版 后五章

Visual C++

空空如也

原创聚类算法：K-Means算法及其实现

spring in action 中文版后五章