聚类算法之Kmeans算法原理与实现

本文介绍了聚类算法中的K-means算法,强调其在无监督学习中的角色。K-means通过计算数据的相似性将数据分为指定数量的类别,以最小化簇内平方误差和。文章详细阐述了算法过程,包括初始中心点的选择、数据点的分配和簇中心的更新,并指出该算法可能不保证全局最优解,但复杂度适中,适用于实际问题。
摘要由CSDN通过智能技术生成

一、前言


      所谓聚类就是把相似的东西聚合在一起,从而起到分组的作用。它和Classification(分类)不同,Classifier(分类器)是从训练集中进行学习,从而获得对未知数据的分类能力,通常我们把这种通过训练而获得分类能力的过程称为监督学习(supervised learning),而在聚类的时候,我们并不关心所有数据是什么类的,我们对这些数据全然不知,我们通过聚类根据数据的某些相似性,通过相似性的大小把它们聚到一起。因此一个聚类算法只要知道如何计算数据的相似性,就可以进行工作了,所以聚类(clustering)并不需要训练数据进行学习,这在Machine Learning 中被称为无监督学习(unsupervised learning)。


二、Kmeans分析

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值