【机器学习-西瓜书】九、K-means;聚类算法划分

推荐阅读: 原型聚类;聚类划分;K-means

9.4 原型聚类

原型聚类亦称基于原型聚类(prototype-based clustering),原型指的是样本空间中具有代表性的点。基于原型的定义是每个对象到该簇的原型的距离比到其他簇的原型的距离更近。在K-means中,聚类中心就是原型,就是具有代表性的点,一个样本距离哪一个原型近,就划分为哪一簇。
常见的原型聚类算法有: K-means;LVQ(learning vector quantization,学习向量量化);高斯混合聚类

9.4.1 K均值算法(K-means)

K-menas算法中的K表示划分为K个簇,K是需要认为预先设定的,这个K和KNN里的K是完全不同的意思,以前刚接触ML,经常混淆KNN和K-means的K。K-means是通过 最小化平方误差: E=ki=1xcixμi2 来划分样本。其中k就表示k个簇, μi 表示第i个簇的聚类中心(第i簇的原型)。E就表示所有样本到各自簇的聚类中心的距离之和,要这个聚类最小,其实就是使得各个簇最紧密。


K-means的算法流程:
Step 1. 给定K,随机初始化每个簇的聚类中心
Step 2.按照欧氏距离,计算每个样本到所有聚类中心距离,样本离哪个聚类中心近,就划分为哪一类。
Step 3. 更新聚类中心:针对每个簇, 利用簇中的样本,求取均值向量,得到新的聚类中心
Step 4. 检查 当前平方误差: “` E=ki=1xcixμi2 是否小于上一次的平方误差,是的话,停止,否则重复 。

通常情况下是设定一定的迭代次数让算法停止。

9.4.2 学习向量量化(LVQ)
LVQ属于神经网络模型
9.4.3 高斯混合聚类
高斯混合聚类(Mixture-of-Gaussian)采用概率模型来表达聚类原型

9.5 密度聚类

密度聚类也称为基于密度聚类(density-based clustering),此类算法假设聚类结构能通过样本分布的紧密程度确定。
DBSCAN(Density-Based Spatial Clustering of Appplication with Noise)是著名的密度聚类算法,它基于一组领域参数来刻画样本的紧密程度(neighborhood)
9.6 层次聚类
层次聚类试图在不同层次对数据集进行划分,从而形成树形的聚类结构。
AGNES(agglomerative nesting)是一种自底向上聚类策略的层次聚类算法。它先将每个样本看作一个簇,再将相近的两个簇进行合并,直到达到预设的聚类簇个数.
计算两个簇(集合)的距离有:最小距离,最大距离,平均距离。

聚类划分:
(1)原型聚类 k-means ;LVQ; 高斯混合聚类
(2)密度聚类 DBSCAN;OPTICS;DENCLUE
(3)层次聚类 AGENS、DIANA、BIRCH、ROCK

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
超市顾客聚类是一种将顾客根据其购物特征进行分组的方法,可以帮助超市了解不同类型顾客的行为模式,并针对性地开展营销和促销活动。k-means聚类算法是一种常用的聚类算法,可以将样本数据划分为k个簇,每个簇内的样本具有相似的特征。 使用k-means聚类算法实现超市顾客聚类分析的步骤如下: 1. 数据准备:收集超市顾客的购物数据,包括购买金额、购买时间、购买商品种类等,将数据整理成特征向量的形式。 2. 选择k值:根据聚类分析的目标和具体问题来确定k值,即将样本数据划分为k个簇。 3. 初始化簇中心:随机选择k个样本作为初始的簇中心。 4. 迭代聚类过程:根据样本与簇中心的距离,将样本分配到最近的簇中,更新簇中心为簇内样本的均值。不断重复这一过程,直到满足终止条件。 5. 结果分析:根据聚类结果,可以对不同类型的顾客进行分析和描述,比如高消费群体、低消费群体、偏好时段等。 6. 营销策略制定:根据不同类型顾客的特征和行为模式,设计针对性的促销活动,提高超市的销售额和顾客忠诚度。 使用k-means聚类算法可以帮助超市识别不同类型的顾客,有效地开展精准化营销。技术的发展,尤其是大数据和机器学习的应用,为超市提供了更多有效的工具和方法来进行市场分析和营销策略制定。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值