K-Means
聚类算法。
基础含义
K-Means是一种聚类算法,它可以把n个对象根据相互之间的相似度,自动划分到K个聚类。 但并不是任意的划分,我们有明确的目标。通俗的讲,目标就是划分后的聚类, 每个类内部相对集中;而聚类与聚类之间则相对离散。
数学原理
给定n个观察点
X1,X2,...,Xn
其中每个观察点 Xi 都是d维向量,也就是说,只要把我们的任何一条数据预处理到d维空间,使得每个 |Xi|=d , 举个例子就是
Xi=[fi1,fi2,...,fid],
其中 fik 就是第k个特征. 那么都可以采用此聚类方法处理数据。
那么我们的目标函数是什么呢?
我们需要划归到 S={
S1,S2,...,Sk} ,其中 Si 是第i个聚类。
目标函数:
argmin∑i=1k(∑X∈Si||X−μi||2)=argmin∑i=1