聚类:知识框架

本文介绍了聚类的基本概念,包括性能度量的外部指标和内部指标,如Jaccard系数、DB指数等。接着,讨论了距离度量在连续和离散属性上的应用。重点讲解了原型聚类中的K均值、LVQ和高斯混合聚类,密度聚类的DBSCAN,以及层次聚类中的AGNES算法。内容深入浅出,适合数据科学初学者。
摘要由CSDN通过智能技术生成

0 简介

样本集D m个样本(无标签的x ) 划分成k个不相交的簇
许多内容直接用的截图,比自己手打方便多了。。

1 性能度量

聚类的结果希望簇内相似度高且簇间相似性低
按照有无给定的结果对照 可以分为外部指标和内部指标

1.1 外部指标

在这里插入图片描述

  • Jaccard系数
    在这里插入图片描述

  • FM指数
    在这里插入图片描述

  • Rand指数
    在这里插入图片描述
    以上三种指数都是越大越好

1.2 内部指标

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值