k-means算法

原创 2018年04月17日 10:08:51

聚类算法选择:
如果数据维度很高,可以选择谱聚类,它是基于选择用聚类密切相关的维度,对子空间进行聚类
如果数据为小规模的少于100万条,可以使用KMEANS,如果超过100万条,可以用考虑使用mini batch kmeans
如果数据有离群点,可以考虑dbscan
如果追求分类准确率,谱聚类比kmeans好

聚类算法常用的指标:
兰德系数(rand index):给定实际类别信息 c,k为聚类的结果,a为c和k都是同类别的元素对,b为不同类别的元素对
RI = (a+b)/C2nsamples
C2nsamples为数据集中可以组成的所有元素对数
RI取值为[0,1],值越大表示聚类效果越好
调整后的兰德系数(ajusted rand index): RIE(RI)max(RI)E(RI)取值为【-1,1】
轮廓系数(silhouette coefficient)a为一个样本与簇内其他样本的平均距离,b为样本与最近簇中所有样本的平均距离,轮廓系数定义为:
s=bamax{b,a}
取值范围为[-1,1]

k-means算法详解

k-means算法详解 主要内容 k-means算法简介 k-means算法详解 k-means算法优缺点分析 1、k-means算法简介   k-means算法是一种聚类算法,所谓聚类,即根据相...
  • zhihua_oba
  • zhihua_oba
  • 2017-06-28 11:04:39
  • 1336

K-means算法的介绍

1、介绍一下聚类 聚类就是类的内部相似,类间不相似 聚类的算法一般包括:划分聚类算法,层次聚类算法,基于密度聚类,基于网格聚类算法。 每一中算法中都包含狠多的具体算法。 基于划分聚类算法包括:...
  • u011955252
  • u011955252
  • 2016-01-18 20:39:22
  • 466

K-means算法研究综述

K-means算法研究综述 聚类被认为是机器学习中最常使用的技术之一, 它历史悠久、应用广泛,几乎应用于环境学、医学、生物学、天文学、经济学等各个领域。其中K-means是最为常用的聚类算法。现...
  • u013473512
  • u013473512
  • 2017-03-18 10:33:39
  • 12114

k-means算法讲解

深入浅出K-Means算法            摘要:在数据挖掘中,K-Means算法是一种 cluster analysis 的算法,其主要是来计算数据聚集的算法,主要通过不断地取离种...
  • ac540101928
  • ac540101928
  • 2016-09-09 09:56:20
  • 1620

K-Means原理分析以及其变种算法

从K-Means到elkan K-Means,再到Mini Batch K-Means K-Means是最普通的聚类方法,应用面比较广。 elkan K-Means是K-Mean算法的变种,用于简...
  • wxf_ou
  • wxf_ou
  • 2017-07-21 11:05:15
  • 621

K-MEANS算法的工作原理及流程

K-MEANS算法:输入:聚类个数k,以及包含 n个数据对象的数据库。输出:满足方差最小标准的k个聚类。处理流程:        (1)  从 n个数据对象任意选择 k 个对象作为初始聚类中心;(2)...
  • zgl_dm
  • zgl_dm
  • 2007-11-19 17:22:00
  • 13674

K-Means算法简介及最新改进Java代码实现

  • 2009年10月16日 10:30
  • 6KB
  • 下载

简单易学的机器学习算法——K-Means算法

一、聚类算法的简介
  • google19890102
  • google19890102
  • 2014-05-18 15:25:44
  • 25136

K-means算法的Matlab实现代码(使用文档+源代码)

  • 2011年10月28日 17:30
  • 23KB
  • 下载

K-means算法的实现原理和分析

一、概述 K-means算法是最为经典的基于划分的聚类方法,是十大经典数据挖掘算法之一。K-means算法的基本思想是:以空间中k个点为中心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各...
  • xiaokang123456kao
  • xiaokang123456kao
  • 2017-07-08 17:36:20
  • 848
收藏助手
不良信息举报
您举报文章:k-means算法
举报原因:
原因补充:

(最多只允许输入30个字)