K-mean聚类算法

最新推荐文章于 2024-08-28 16:05:19 发布

fengziyihang

最新推荐文章于 2024-08-28 16:05:19 发布

阅读量628

点赞数

分类专栏：聚类文章标签： K-mean

本文链接：https://blog.csdn.net/fengziyihang/article/details/79815698

版权

聚类专栏收录该内容

4 篇文章 0 订阅

订阅专栏

K-mean算法属于非监督类算法，模型相对简单。

目标函数 J = sum（dj*I{xi属于j类}）

算法：

1、初始化K个点；

2、样本xi,到k个点的距离为

dk = ||xi - uk||;

j = argmin（j） dk；

xi属于cj；

3、更新参数：

uk = sum（xi*I{xi属于cj}）/sum(I{xi属于cj});

重复2和3，终止条件J的变化很小或者uk变化很小。

整个算法结束了，但是结果是局部最优，初始值很重要，所以很多时候会多次初始化重复计算，找到一个稳定的解。

缺点与优点：

优点：

1、模型简单、速度快；

2、对处理数据，具有很强的伸缩性和高效性；

缺点：

1、K的值很难确定；

2、对噪声很敏感；

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

fengziyihang

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

K-Mean聚类算法

weixin_45856170的博客

06-19

1959

K-means的网络整合与部分个人看法

聚类算法之K-mean算法

sunanger_wang的专栏

04-26

2万+

Clustering 中文翻译作“聚类”，简单地说就是把相似的东西分到一组，同 Classification (分类)不同，对于一个 classifier ，通常需要你告诉它“这个东西被分为某某类”这样一些例子，理想情况下，一个 classifier 会从它得到的训练集中进行“学习”，从而具备对未知数据进行分类的能力，这种提供训练数据的过程通常叫做 supervised learning (监督

参与评论您还未登录，请先登录后发表或查看评论

k-means算法

bookwormno1的专栏

10-19

3694

漫谈 Clustering (1): k-means 该文转自：http://blog.pluskid.org/?p=17 by pluskid, on 2008-12-29, in Machine Learning 41 comments 本

K-means聚类算法

weixin_30725467的博客

09-09

1892

一、K-means聚类算法简介 K-means算法是典型的基于距离的聚类算法，即对各个样本集采用距离作为相似性的评价指标，若两个样本集的距离越近，其相似度就越大。按照样本之间的距离大小，将样本集划分为K个簇。让簇内的点尽量紧密的连在一起，且让簇间的距离尽量的大。最后把得到紧凑且独立的簇作为最终的目标。二、相关知识点 1、距离度量：不同的距离量度会对距离的结果产生影响，...

k-means聚类算法

刘明的博客

04-01

1万+

聚类算法 聚类算法是一种典型的无监督学习算法，该算法将样本划分为若干个不相交的簇。聚类结果簇内相似度高，簇间相似度低。常用的相似度计算方法为欧氏距离。常用的聚类算法有：原型聚类、层次聚类、密度聚类 k-means算法 k-means算法首先随机选取k个质心，计算每个样本和k个质心的相似度（欧氏距离），选择相似度最高的质心所在的簇作为该样本的类别，形成k个簇。然后重新计算每个簇的质心（当前...

详解Java实现的k-means聚类算法

08-28

Java实现的k-means聚类算法详解 k-means聚类算法是一种常用的无监督学习算法，用于对数据进行聚类分析。该算法的主要思想是将相似的数据点聚类到一起，形成不同的簇。Java语言是实现k-means聚类算法的不二之选。 ...

聚类算法：K-means聚类图像分割

12-22

K-Means聚类是最常用的聚类算法，最初起源于信号处理，其目标是将数据点划分为K个类簇，找到每个簇的中心并使其度量最小化。该算法的最大优点是简单、便于理解，运算速度较快，缺点是只能应用于连续型数据，并且要在...

K-mean聚类算法C++实现源码+文档.zip

03-10

K-Mean聚类算法是一种广泛应用的数据挖掘技术，用于无监督学习中的分类问题。它通过将数据集中的对象分配到预定义数量的类别中，使得同一类别内的对象相似度尽可能高，而不同类别间的对象相似度尽可能低。在这个...

基于k-means聚类算法实现三维数据分类含Matlab源码

07-09

k-means聚类算法是其中最简单且广泛使用的算法之一，尤其适用于处理大规模数据集。本篇文章将深入探讨如何在Matlab环境下实现k-means算法对三维数据进行分类，并结合提供的源代码进行解析。首先，k-means算法的...

k均值聚类算法（k-menans)

07-28

k均值聚类算法，k-means，实现

K-MEANS(K均值聚类算法,C均值算法)

01-15

K-MEANS(K均值聚类算法,C均值算法) K-MEANS(K均值聚类算法,C均值算法) K-MEANS(K均值聚类算法,C均值算法)

Python用K-means聚类算法进行客户分群的实现

12-17

【Python K-means聚类算法实现客户分群】在数据科学和市场营销中，客户分群是一种常用的方法，它能够帮助商家识别不同的客户群体，以便更好地理解客户需求，制定更有效的营销策略。K-means聚类算法是实现这一目标...

聚类算法-Kmeans聚类

最新发布

2301_77698138的博客

08-28

1544

K-means 聚类广泛应用于市场细分、图像分割、文档聚类等领域。例如，在市场营销中，可以将客户划分为不同的群体，以便进行更针对性的推广策略；在图像处理中，可以将图像分割成多个区域，以便进一步分析或压缩。但同时也拥有自己的优缺点。优点：简单易实现。对大数据集具有较好的可扩展性。当簇的密度大致相同且簇间分离良好时，效果非常好。缺点：需要预先指定 K 值，而 K 的选择通常不直观。结果可能受到初始质心选择的影响，可能导致局部最优解。对异常值（噪声）和簇的形状（非球形）敏感。

机器学习算法之K-means（K均值聚类）算法

tttaeyang的博客

10-08

7206

聚类聚类，简单来说，就是将一个庞杂数据集中具有相似特征的数据自动归类到一起，称为一个簇，簇内的对象越相似，聚类的效果越好。它是一种无监督的学习(Unsupervised Learning)方法,不需要预先标注好的训练集。聚类与分类最大的区别就是分类的目标事先已知，例如猫狗识别，你在分类之前已经预先知道要将它分为猫、狗两个种类；而在你聚类之前，你对你的目标是未知的，同样以动物为例，对于一个动物集来...

K-mean

HUNXIAOYI561的博客

05-05

787

k-均值是发现给定数据集的k个簇的算法。簇个数k是用户给定的，每一个簇通过其质心，即簇中所有的中心来描述。 K-均值算法的工作流程是这样子的：首先，随机确定k个初始点作为质心。然后将数据集中的每个点分配到一个簇中，具体来讲，为每个点找距其最近的质心，并将其分配给该质心所对应的簇。这一步完成之后，每个簇的质心更新为该簇所有点的平均值。上述过程的伪代码如下：创建k个点作为起始质心（经常是随机...

K-means聚类模型（超详细，含案例代码）