K-means原理与代码实现

1、关于聚类与分类

聚类,是将相似的样本聚集成一簇,属于无监督学习,输入的样本没有给定类别标签y,只有样本x;聚类的目的就是找到每个样本x潜在的类别y,并且将x归于类别y的过程;同一类别“距离”较近,而不同类别之间“距离”较远。常见的聚类算法有:K-Means, K-Medoids, GMM, Spectral clustering,Ncut(本节暂时只解释k-means,后面几种随后几章会解释)。
分类,输入是样本和对应标签,(x,y),经过训练,实现能够判断任意输入样本的类别,属于有监督学习。常见的分类算法有:SVM,naïve Bayes、logistics regression等。

2、k-means概述

k-means算法是聚类算法的一种,算法过程如下:

输入:样本,将这n个样本聚类为k类,其中k<=n;

(1)随机选取k个聚类质心点,为;

(2)对每个,计算其与的距离,将距离某个距离近的样本暂时聚为一类,计算其应该属于的类;公式为:

(3)重新计算每个

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值