kmeans算法:给定样本集D={x1,x2,x3,…,xm},针对聚类所得簇划分为k个簇,计算每个样本和簇之间的最小化平方误差。
算法过程:选取k个样本作为初始化均值向量,计算每个样本与当前均值向量的距离,选区当前样本与当前均值向量最近的哪一个,把当前样本归于这个均值向量,对所有样本都考察一遍以后,所有样本都归于某一个均值向量当中,然后求出新的均值向量。再计算所有样本与新的均值向量之间的距离,重复以上步骤,直到达到最大运行轮数或者最小调整幅度。
LVQ算法(学习向量量化):这个算是有监督的学习,每个样本有n和特征,也有对应的标记。首先从样本种选出一些样本作为原型向量,且都有预设的类别标记。
计算某个样本x1与原型向量之间的距离,找出与x1距离最近的原型向量,如果x1的标记和原型向量的预设标记一样,那么令原型向量往x1的方向靠拢;若不一样,则远离x1。这样我们的簇就不断移动,直到达到最大迭代轮数。
高斯混合聚类:计算每个样本被归于某个簇的概率,簇划分是由原型对应的后验概率确定。
密度聚类:DBSCAN算法
领域其实就是某一个半径内,假设半径为5,我们先看P点以半径为5画的圆中包含3个点,而q点以半径为5画7个点 7>5,所以q就叫做核心对象。p不是核心对象。理解就是这么简单,再看看什么叫密度可达,见下图: