西瓜书+实战+吴恩达机器学习(十四)无监督学习之聚类(k-means, LVQ, 高斯混合聚类, DBSCAN, AGNES)

本文深入探讨无监督学习中的聚类方法,包括k-means、LVQ、高斯混合聚类、DBSCAN和AGNES。详细解释了聚类的性能度量、距离计算,并对各种聚类算法的原理和实现进行了阐述。
摘要由CSDN通过智能技术生成

如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~

0. 前言

无监督学习意味着样本的标记信息是未知的,目标是揭示数据的内在规律

聚类试图将数据集划分为不同的子集,称为“簇”

1. 性能度量

聚类应达到簇内相似度高,簇间相似度低

1.1. 外部指标

外部指标意味着将聚类结果与某个参考模型比较

给出数据集 D D D,聚类结果簇划分 C C C,参考模型簇划分 C ∗ C^* C,以及对应簇标记 λ ,   λ ∗ \lambda,\ \lambda^* λ, λ,定义:
a = ∣ S S ∣ ,    S S = { ( x i , x j ) ∣ λ i = λ j , λ i ∗ = λ j ∗ , i &lt; j } b = ∣ S D ∣ ,    S D = { ( x i , x j ) ∣ λ i = λ j , λ i ∗ ≠ λ j ∗ , i &lt; j } c = ∣ D S ∣ ,    D S = { ( x i , x j ) ∣ λ i ≠ λ j , λ i ∗ = λ j ∗ , i &lt; j } d = ∣ D D ∣ ,    D D = { ( x i , x j ) ∣ λ i ≠ λ j , λ i ∗ ≠ λ j ∗ , i &lt; j } a=|SS|,\ \ SS=\{(x_i,x_j)\mid \lambda_i=\lambda_j,\lambda_i^*=\lambda_j^*,i&lt;j\}\\ b=|SD|,\ \ SD=\{(x_i,x_j)\mid \lambda_i=\lambda_j,\lambda_i^*\neq\lambda_j^*,i&lt;j\}\\ c=|DS|,\ \ DS=\{(x_i,x_j)\mid \lambda_i\neq\lambda_j,\lambda_i^*=\lambda_j^*,i&lt;j\}\\ d=|DD|,\ \ DD=\{(x_i,x_j)\mid \lambda_i\neq\lambda_j,\lambda_i^*\neq\lambda_j^*,i&lt;j\} a=SS,  SS={ (xi,xj)λi=λj,λi=λj,i<j}b=SD,  SD={ (xi,xj)λi=λj,λi̸=λj,i<j}c=DS,  DS={ (xi,xj)λi̸=λj,λi=λj,i<j}d=DD,  DD={ (xi,xj)λi̸=λj,λi̸=λ

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值