聚类
文章平均质量分 73
Azoobie
这个作者很懒,什么都没留下…
展开
-
距离和相似性度量
1. 计算距离r语言中使用dist(x, method = "euclidean",diag = FALSE, upper = FALSE, p = 2)来计算距离。 x是样本矩阵或者数据框。method表示计算哪种距离。method的取值有:euclidean 欧几里德距离,就是平方再开方。maximum 切比雪夫距离manhattan 曼哈顿距离,绝对值原创 2016-08-01 18:39:04 · 3799 阅读 · 0 评论 -
基于距离的聚类方法--K-means
1. K-means确定k个划分达到平方误差最小优点:算法快速,简单;对大数据集有较高的效率并且可伸缩;时间复杂度接近于线性并且适合挖掘大规模数据集。缺点:k值的选定难以估计,初始类聚类中心点的选取对聚类结果有较大的影响;数据量大时,算法的时间开销大。算法过程:输入:k,data1) 选取k个点作为质心;2) 计算剩余的点到质心的距离并将点归到最近的质心的类;3)原创 2016-08-02 17:21:00 · 31469 阅读 · 0 评论