机器学习笔记-聚类2

这篇博客详细介绍了聚类算法,包括Mini-batch k-Means的优化策略,以及层次聚类中的AGNES和DIANA算法。此外,还探讨了密度聚类的代表——DBSCAN算法,阐述了其如何定义密度相连的点集合作为簇,并解释了DBSCAN的运行流程及簇的构成特点。
摘要由CSDN通过智能技术生成

Mini-batch k-Means:在原始k-Means中只取部分样本做均值或对于目标函数中只取部分样本做梯度下降。
在这里插入图片描述
在这里插入图片描述
层次聚类:
凝聚的层次聚类-AGNES算法:一种自底向上的策略,首先将每个对象作为一个簇,然后根据某些准则合并这些子簇为越来越大的簇,两个簇间的距离由这两个不同簇中距离最近的数据点的相似度来确定,合并过程反复进行直到所有的对象最终满足簇数目。
分类的层次聚类-DIANA算法:采用自顶向下的策略,它首先将所有对象置于一个簇中,然后根据某些准则,将该簇分为越来越小的簇,直到到达用户指定的簇的数目或者两个簇之间的距离超过某个阈值。
AGNES较于DIANA更常用,AGNES中簇间距离的不同定义:
最小距离:两个集合中最近的两个样本的距离,使用该准则容易形成链状结构
最大距离:两个集合中最远的两个样本的距离complete,若存在异常值则不稳定
平均距离:1)两个集合中样本间两两距离的平均值average
2)两个集合中样本间两两距离的平方和平均值ward

密度聚类:
只要样本点的密度大于某阈值,则将该样本添加到最近的簇中
DBSCAN:将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在有“噪声”的数据中发现

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值