数据挖掘十大算法之k均值聚类算法

标签: 数据挖掘
16人阅读 评论(0) 收藏 举报
分类:

K-Means算法

K-Means是一种聚类算法,属于无监督学习方法的一种。也是基于原型的聚类算法。简单的介绍就是选取k个中心点,形成簇,然后不断更新中心点,直至簇不再改变。

算法流程

  • 随机生成k个初始点作为中心点
  • 将数据集中的数据按照距离中心点的远近分到各个簇中
  • 将各个簇中的数据求平均值,作为新的中心点,重复上一步,直到所有的簇不再改变

距离的选择

  • 欧氏距离 每个维度的差的平方之和
  • 曼哈顿距离 每个维度的差的绝对值之和
  • 切比雪夫距离 每个维度中最大的差的绝对值
  • 相关系数

优点

  • 易于实现,理解简单。

缺点

  • k的值不好确定,不能准确判断出样本应有几个中心点。
  • 不适用于大型样本,可用mini-batch方法选取部分样本来计算中心点
  • k均值算法不能处理非球形簇、不同尺寸和不同密度的簇,这时需要用到其他聚类算法。
  • 初始中心点的选择对算法有很大影响。
  • 离群数据点对中心点的计算有很大影响。所以去除离群点有助于提高算法准确率。
  • 易收敛于局部最优值,可用二分k均值算法解决这个问题。
查看评论

聚类算法之K均值算法C++实现

本算法为聚类算法之K均值算法,基本原理如下K-均值聚类算法  1.初始化:选择K个代表点2.按欧式距离,把剩余点归入离自己最近的代表点的集合  3.计算每个集合的平均值点,作为新的K个代表点 4...
  • qq_32915415
  • qq_32915415
  • 2016-11-22 23:12:34
  • 390

数据挖掘/机器学习算法--直接聚类算法(k-means)

大家好!我是钱大鑫!本篇博客我主要跟大家探讨一下经典聚类算法——k-means。还是那句话,学习算法不是一件可以瞬间学会的事情,大家慢慢读,慢慢领悟,内容绝大部分为会设计到一些数学知识,算法嘛,正常的...
  • qianxin_HadoopBird
  • qianxin_HadoopBird
  • 2017-03-22 11:49:49
  • 810

Thinking in SQL系列之五:数据挖掘K均值聚类算法与城市分级

SQL做为一种编程语言,能够满足各类数据处理的需要,关键就在于算法与思维方式。个人经常调侃SQL思考问题比大部分流行的开发语言多一个维度,因为SQL主要是二维思考(集合)、区别于一维(数据结构)的思维...
  • NcFire
  • NcFire
  • 2017-02-24 01:41:07
  • 1819

数据挖掘十大算法

  • 2014年06月19日 19:18
  • 3.97MB
  • 下载

数据挖掘十大算法总结--核心思想,算法优缺点,应用领域

参考了许多资料加上个人理解,对十大算法进行如下分类: •分类算法:C4.5,CART,Adaboost,NaiveBayes,KNN,SVM •聚类算法:KMeans •统计学习:EM •关联分析:A...
  • xie20112480233
  • xie20112480233
  • 2014-11-03 10:43:01
  • 9504

数据挖掘十大算法 高清完整版

  • 2017年11月26日 17:39
  • 45MB
  • 下载

十大经典数据挖掘算法之K-Means算法

1、K-means算法简介          K-means是最简单的聚类算法之一,简单地说就是把相似的东西分到一组,同 Classification (分类)不同,对于一个 classifier ...
  • zmx729618
  • zmx729618
  • 2015-08-11 15:45:23
  • 5592

数据挖掘——聚类算法kmeans整理

【 kmeans算法原理】 随机选取k个中心点 遍历所有数据,将每个数据划分到最近的中心点中(根据距离的大小进行划分,即计算每个样本点到所有中心点的距离,选择距离最小的那个) 计算每个聚类的平均值,并...
  • adminabcd
  • adminabcd
  • 2016-05-16 23:09:40
  • 1789

k均值聚类算法MATLAB程序及注释

  • 2016年07月03日 12:01
  • 37KB
  • 下载

聚类算法——K均值算法的matlab程序

  • 2016年01月05日 20:28
  • 7KB
  • 下载
    个人资料
    持之以恒
    等级:
    访问量: 2133
    积分: 213
    排名: 36万+
    文章分类
    文章存档