机器学习之聚类(二)

本文详细探讨了机器学习中的聚类算法,包括层次聚类、密度聚类、谱聚类及其在标签传递算法中的应用,特别是重点讨论了在谱聚类中选择随机游走拉普拉斯矩阵的原因。
摘要由CSDN通过智能技术生成

一、层次聚类算法

    层次聚类方法对给定的数据集进行层次的分解,直
到某种条件满足为止。具体又可分为:
    凝聚的层次聚类:AGNES算法: 一种自底向上的策略,首先将每个对象作为一个簇,然 后合并这些原子簇为越来越大的簇,直到某个终结条件被满足;
    分裂的层次聚类:DIANA算法:采用自顶向下的策略,它首先将所有对象臵于一个簇中,然后逐渐细分为越来越小的簇,直到达到了某个终结条件;
    AGNES:最初将每个对象作为一个簇,然后这些簇根据某些准则被一步步地合并。两个簇间的距离由这两个不同簇中距离最近的数据点对的相似度来确定;聚类的合并过程反复进行直到所有的对象最终满足簇数目;
    AGNES中簇间距离不同定义:
            最小距离:两个集合中最近的两个样本的距离; 容易形成链状结构
            最大距离:两个集合中最远的两个样本的距离complete;若存在异常值则不稳定
            平均距离:两个集合中样本间两两距离的平均值average;两个集合中样本间两  两距离的平方和ward;
    DIANA:首先将所有的对象初始化到一个簇中,然后根据一些原则(比如最大的欧式距离),将该簇分类。直到到达用户指定的簇数目或者两个簇之间的距离超过了某个阈值;

二、密度聚类

     密度聚类方法的指导思想是,只要样本点的密度大于某阈值,则将该样本添加到最近的簇中,该类算法能克服基于距离的算法只能发现“类圆形”(凸)的聚类的缺点,可发现任意形状的聚类,且对噪声数据不敏感。但
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值