github上的项目,跟着一起学习
项目地址 https://github.com/MLEveryday/100-Days-Of-ML-Code
转到无监督学习,并研究了聚类。可在作者网站查询。发现一个奇妙的动画有助于理解K-均值聚类。
学习笔记
动画是关于,怎么把一些没有标记的点,分为各个簇,并调整簇中心位置,使划分更好。
无监督学习
聚类算法:把族群或数据点分成一系列的组,使得相同簇中的数据点比其他的组更相似。
K-均值聚类:把所有项分成k个簇,相同簇中的所有项彼此尽量相似,不同簇的项尽量不同。
距离测量(类似欧式距离)用于计算数据点的相似度和相异度。每个簇有一个形心,最能代表簇的节点。
K-均值聚类如何工作
K-均值聚类的目标,使总体群内方差最小,或平方误差函数: