K-means聚类算法

最新推荐文章于 2023-01-05 09:46:54 发布

原创最新推荐文章于 2023-01-05 09:46:54 发布 · 712 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #算法

----------机器学习专栏收录该内容

3 篇文章

订阅专栏

K-means算法是一种无监督的机器学习算法。无监督学习即事先不知道要寻找的内容。全自动分类，将相似对象归到同一个簇中。用户预先给的K个簇，每个簇通过“质心”来描述。

伪代码：

创建K个点作为起始质心（一般随机选择）
任意一个点所属簇的结果发生改变时
    对数据集中每个点
        对每个质心
            计算数据与质心间的距离
        将数据划分到与它最近的簇
    对于每个簇，重新计算质心（所有点的均值）

求距离的方法，欧氏距离。

聚类效果的度量。一般计算SEE（误差平方和），SEE越小表示数据点越接近他们的质心。

一般误差原因：k的选取。

改进: 二分 K-均值算法
首先将所有点作为一个簇，然后将该簇一分为二。之后选择一个簇继续划分，选择哪个取决于是否可以最大程度降低SEE的值。直到取得合适的K值为止。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

mfcheer

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

K-Means算法详细介绍(SSE、轮廓分析)

修炼之路

04-29

4万+

在前面我们介绍过了很多的监督学习算法，分类和回归。这篇文章主要介绍无监督算法，通过聚类分析来处理无类标数据。我们事先并不知道数据的正确结果(类标)，通过聚类算法来发现和挖掘数据本身的结构信息，对数据进行分簇(分类)。聚类算法的目标是，簇内相似度高，簇间相似度低。有点像LDA降维算法，类内方差最小，类间方差最大。这篇文章主要包括：1、K-Means算法2、K-Means++3、硬聚类和软聚类4、聚类...

【机器学习-14】K-means聚类算法：原理、应用与优化

最新发布

qq_38614074的博客

04-07

10万+

在众多聚类算法中，K-means算法因其简单高效而备受青睐。K-means算法的基本思想是：通过迭代的方式，将数据划分为K个不同的簇，并使得每个数据点与其所属簇的质心（或称为中心点、均值点）之间的距离之和最小。具体来说，K-means算法的执行过程通常包括以下几个步骤：首先，随机选择K个数据点作为初始的簇质心；然后，根据每个数据点与各个簇质心的距离，将其分配给最近的簇；接着，重新计算每个簇的质心，即取簇内所有数据点的平均值作为新的质心；

参与评论您还未登录，请先登录后发表或查看评论

无监督聚类评价指标

weixin_42783619的博客

06-05

6443

无监督聚类评价指标文章目录无监督聚类评价指标SEE、SC和CH评价指标-轮廓系数法(SC)评价指标-CH系数法无监督聚类算法结果好坏的评价指标Compactness(紧密性)(CP)Separation(间隔性)(SP)Davies-Bouldin Index(戴维森堡丁指数)(分类适确性指标)(DB)(DBI)Dunn Validity Index (邓恩指数)(DVI)参考： SEE、SC和CH 误差平方和（Sum of the Squared Errors， SSE），轮廓系数（Silhouette

聚类算法效果衡量标准及图片压缩案例

m0_47482052的博客

01-05

666

聚类算法效果衡量标准及图片压缩案例

聚类︱python实现六大分群质量评估指标（兰德系数、互信息、轮廓系数）

素质云笔记

04-24

6万+

之前关于聚类题材的博客有以下两篇： 1、笔记︱多种常见聚类模型以及分群质量评估（聚类注意事项、使用技巧） 2、k-means+python︱scikit-learn中的KMeans聚类实现 . 1 R语言中的分群质量——轮廓系数因为先前惯用R语言，那么来看看R语言中的分群质量评估，节选自笔记︱多种常见聚类模型以及分群质量评估（聚类注意事项、使用技巧）：没有固定标准，一般会...

K-means（K均值原型聚类）

nakaizura

10-14

1万+

K-means原理,python实现，改进，sklearn应用，SPSS应用。所谓物以类聚，人以群分。相似的人们总是相互吸引在一起。数据也是一样。在kNN中，某个数据以与其他数据间的相似度来预测其标签，而K-means是一群无标记数据间的因为自我相似的聚拢。显而易见，K-means的目标为簇内密集而簇间稀疏。简单来说就是首先先确定k个初始点作为质心，然后将数据集中的每一个点分配到一个距其最近的簇中..........

基于K-means聚类算法的图像分割(MATLAB实现).rar_ASV聚类_K-Means图像分割_k means_rest

07-14

《基于K-means聚类算法的图像分割在MATLAB中的实现》图像分割是计算机视觉领域中的基础任务，它旨在将图像划分为多个区域或对象，每个区域具有相似的特征。K-means聚类算法是一种广泛应用的数据分析方法，它通过...

详解Java实现的k-means聚类算法

08-28

Java实现的k-means聚类算法详解 k-means聚类算法是一种常用的无监督学习算法，用于对数据进行聚类分析。该算法的主要思想是将相似的数据点聚类到一起，形成不同的簇。Java语言是实现k-means聚类算法的不二之选。 ...

python基于K-means聚类算法的图像分割

09-18

在本文中，我们将深入探讨如何使用Python中的K-means聚类算法进行图像分割。K-means是一种经典的无监督机器学习算法，它通过迭代过程将数据点分配到最近的聚类中心，最终达到聚类的目的。在图像处理领域，图像可以被...

Python用K-means聚类算法进行客户分群的实现

12-17

【Python K-means聚类算法实现客户分群】在数据科学和市场营销中，客户分群是一种常用的方法，它能够帮助商家识别不同的客户群体，以便更好地理解客户需求，制定更有效的营销策略。K-means聚类算法是实现这一目标...

数据降维一和机器学习开发流程

weixin_44340805的博客

10-24

194

1.特征选择主要方法，过滤式，嵌入式，包裹式 PCA主成分分析法，消减回归分析或者聚类分析中特征的数量

使用k-means聚类算法对矩阵元素进行分类

SKPrimin的博客

07-12

4180

4.2 使用k-means聚类算法对矩阵元素进行分类实验目的了解k-means聚类算法的原理了解k-means聚类算法中各参数的含义以及对聚类结果的影响熟练安装python扩展库sklearn。了解使用sklearn 库中k-means聚类算法解决问题的基本思路。实验内容编写程序，使用k-means聚类方法对已知数据进行聚类，然后对未知样本进行分类。数据自己进行模拟生成，要求为整数，样本个数至少为 100个，类别作为输入参数。 k-means 算法的基本思想：以空间k个点为中心进行

k-means聚类时使用SSE(簇内误方差)进行最优K的选取

赴前尘

08-24

8383

# -*- coding: utf-8 -*- import pandas as pd from sklearn.cluster import KMeans import matplotlib.pyplot as plt ''' k-means最优K的选取 ''' data_Path = 'dataset/first_round_training_data.csv' df_features = ...

浅谈简单线性回归(Simple linear regression)part3SEE,MSE,SSE的关系

CSDNXXCQ的博客

01-31

2263

MSE→均方根误差(各数据偏离真实值差值的平方和的平均数 )→Meansquared erro SEE→标准估计误差→standard estimated errors 目的:描述真实值与预测值之间的距离 SSE→和方差、误差平方和→The sum of squares dueto error 观察SEE公式可知，当为0时与SSE公式十分相似 ...

聚类算法——层次聚类算法

lin

02-11

1万+

每篇一句： You must strive to find your own voice. Because the longer you wait to begin, the less likely you are to find it at all. –你必须努力去寻找自己的声音，因为你越迟开始寻找，找到的可能性越小。层次聚类算法：层次聚类算法（Hierarchical Clu

机器学习之k-means算法详解

平原的博客

07-02

5万+

K-means算法（无监督算法，聚类算法） 1-1 基本流程一、概念：二、主要特点：三、算法流程： kmeans作用：去除奇异值小结： 1-2 算法效果衡量标准一、K值确定：二、轮廓系数：三、Canopy算法配合初始聚类： 1、Canopy简介： 2、Canopy+Kmeans：四、Calinski-Harabasz Index： K-m...

K-means 聚类

bbtfubin的博客

05-29

1101

K-means 聚类文章目录K-means 聚类实验目标算法原理算法流程图实验结果分析中心点选择方法1中心点选择方法2代码实验目标对 cluster.dat 里的数据进行聚类分析。其中，cluster.dat 包含了若干二维输入数据（但不包含其输出）。使用 K-means 模型进行聚类，尝试使用不同的类别个数 KKK，并分析聚类结果。按照 8:2 的比例随机将数据划分为训练集和测试集，至少尝试 3 个不同的 KKK 值，并画出不同 KKK 下的聚类结果，及不同模型在训练集和测试集上的损

机器学习：k-means聚类效果评估

l974415301的博客

02-22

3万+

接着上一回的工作，用kmeans聚类之后，感觉肘部法则有些问题，今天又看了一遍代码，发现fit（）函数的参数输错了，应该输入归一化之后的X_norm 今天查阅了各种同学的分享，太多了，就不给出链接了，对聚类算法的评估，我筛选了下面三种方法第一种 SSE 样本距离最近的聚类中心的距离总和（簇内误差平方和）只对单个族中的数据分析，族与族之间的关系没有涉及所以可能有一定的问题在sklearn...

无监督学习——聚类（k-means算法）

乐亦亦乐的博客

08-12

2万+

无监督学习是一种对不含标记的数据建立模型的机器学习范式。无监督学习应用领域： - 数据挖掘 - 医学影像 - 股票市场分析 - 计算机视觉 - 市场分析最常见的无监督学习就是聚类。聚类的定义：聚类就是对大量未知标注的数据集，按数据的内在相似性将数...