【机器学习】聚类分析的模型评估

最新推荐文章于 2024-08-20 22:43:27 发布

weixin_34082695

最新推荐文章于 2024-08-20 22:43:27 发布

阅读量4.3k

点赞数

文章标签：人工智能

原文链接：http://www.cnblogs.com/cry-star/p/10815553.html

版权

本文介绍了聚类分析中的距离计算，如余弦距离，并探讨了聚类算法的评估标准，包括轮廓系数、调整兰德指数、互信息、同质性、完整性以及Calinski-Harabaz指数。这些指标用于衡量聚类效果，其中轮廓系数和调整兰德指数在不知道真实类别信息的情况下也能进行评估。

摘要由CSDN通过智能技术生成

　　一、聚类算法中的距离

　　1. 单个样本之间的距离

　　余弦距离

　　在聚类分析中，一般需要对数据进行标准化，因为聚类数据会受数据量纲的影响。

　　在sklearn库中，可调用如下方法进行标准化：

1 from sklearn.preprocessing import StandardScaler
2 data = StandardScaler().fit_transform(data)

　　这种方法将data的均值和方差保存下来，并使用它们对数据进行归一化，这样，有新的数据输入时，仍可以沿用data的均值和方差来做归一化。

　　【联】facenet中是采用的L2归一化，这和每个向量自身相关，而不是和整体数据相关。

　　在上述距离中，受量纲影响较大的是明氏距离和欧氏距离（明氏距离的特例），马氏距离和余弦距离则受量纲影响较小。

　　其中，余弦距离越大（趋近于1），代表两个向量的方向越接近，相似度越高。

　　2. 两个聚类簇之间的距离

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_34082695

关注关注

0
点赞
踩
16

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

聚类模型以及分群质量评估

qq_43893567的博客

03-20

2291

聚类分析：用于客户细分极为重要。三类常见的聚类模型，K-Means,层次聚类，最大期望EM算法，其他的还有密度聚类如何评价聚类结果好坏，一些常用的指标又有哪些 聚类分析的目的：让类群内观测的距离最近，同时不同全体之间的距离最大 1.聚类分析的距离问题：样本聚类距离：欧式距离，绝对值距离，明式距离，马氏距离。概率分布的距离衡量：k_l代表P,Q概率分布差的期望 聚类分析一般要进行标准化，因为聚类...

聚类模型ari_【机器学习】聚类分析的模型评估

weixin_29188759的博客

01-14

607

一、聚类算法中的距离1. 单个样本之间的距离余弦距离在聚类分析中，一般需要对数据进行标准化，因为聚类数据会受数据量纲的影响。在sklearn库中，可调用如下方法进行标准化：1 from sklearn.preprocessing importStandardScaler2 data = StandardScaler().fit_transform(data)这种方法将data的均值和方差保存下来，...

参与评论您还未登录，请先登录后发表或查看评论

全国大学生数学建模比赛——聚类模型（深度解读）

weixin_66547608的博客

08-20

742

聚类是将数据对象分组为多个类或簇的过程，使得同一簇中的对象之间具有较高的相似性，而不同簇中的对象之间具有较大的差异性。在数学建模中，聚类模型可以帮助我们发现数据中的潜在结构和模式，为问题的分析和解决提供有价值的信息。最后绘制折线图，展示不同聚类数量下的模型效果，以帮助确定最佳的聚类数量。横坐标为聚类数量，纵坐标为效果，通过观察折线图的趋势，可以选择一个合适的聚类数量，使得模型在该数据集上的表现最佳。接着绘制散点图，用不同颜色表示不同的聚类，红色圆圈表示聚类中心，直观地展示了聚类结果。

聚类模型评估

weixin_43668299的博客

07-30

249

1，https://www.cnblogs.com/alice-wayne/p/7049363.html 2，https://www.cnblogs.com/czhwust/p/mlclusterpre.html 3，https://www.jianshu.com/p/b9528df2f57a（重要）

评估聚类模型

wj1298250240的博客

12-28

485

评估聚类模型轮廓系数聚类评估：轮廓系数(Silhouette Coefficient)： https://www.jianshu.com/p/6352d9d468f8 si接近1，则说明样本i聚类合理。 si接近-1，则说明样本i更应该分类到另外的簇。若si近似为0，则说明样本i在两个簇的边界上。 silhouette_score 返回的是平均轮廓系数 # 评估聚类模型 import nu...

聚类算法（KMeans）模型评估方法（SSE、SC）及案例

linxinyide的博客

01-19

6569

速通聚类算法中的KMeans方法，学习模型评估方法（误差平方和SSE、轮廓系数法SC），用肘方法确定K值，并在具体案例中应用。

机器学习（聚类分析模型应用）

qq_59575710的博客

12-03

665

对K-means算法的基础使用来解决实际问题，并画出二维可视化结果和三维图

机器学习-聚类分析.pdf

03-16

聚类分析是机器学习中的一个重要分支，它是一种无监督学习技术，主要应用于处理未标记的数据集，通过对数据的分析和组织，将相似的数据归为一类，形成不同的类簇。聚类分析可以揭示数据的内在结构，帮助我们发现数据...

在R中使用高斯混合模型，多分布下的概率聚类与模型评估

最新发布

09-03

高斯混合模型（Gaussian Mixture Model, GMM）是一种基于概率论的高级聚类算法，广泛应用于数据科学和机器学习领域。与传统的K-means聚类不同，GMM假设数据点是由多个高斯分布（正态分布）组成的混合模型生成的。这...

聚类评估指标分析

01-02

几十种聚类评估方法，包含类内评估和类间评估。说到聚类性能比较好，就是说同一簇的样本尽可能的相似，不同簇的样本尽可能不同，即是说聚类结果“簇内相似度”（intra-cluster similarity）高，而“簇间相似度”（inter-cluster similarity）低。聚类性能的评估（度量）分为两大类：外部评估（external evaluation）：将结果与某个“参考模型”（reference model）进行比较；内部评估（internal evaluation）：直接考虑聚类结果而不利用任何参考模型。

层次聚类的评价

06-28

关于层次聚类的评价指标

聚类算法之模型评估

IT之一小佬的博客

04-16

2303

聚类算法之模型评估 1 误差平方和(SSE \The sum of squares due to error)：举例:(下图中数据-0.2, 0.4, -0.8, 1.3, -0.7, 均为真实值和预测值的差) 在k-means中的应用: 公式各部分内容: 【c为2类，m代表当前c类的聚心/质心，p为c类中所有点】上图中: k=2 SSE图最终的结果,对图松散度的衡量.(eg:SSE(左图)<SSE(右图)) SSE随着聚类迭代,其值会越来越小,直到最后趋于稳定: ...

数据分析方法-聚类算法

花与花

12-30

3891

文章目录一、定义二、聚类、分类区别分类聚类常用算法一、定义聚类（Clustering）就是一种寻找数据之间内在结构的技术。聚类把全体数据实例组织成一些相似组，而这些相似组被称作簇。处于相同簇中的数据实例彼此相同，处于不同簇中的实例彼此不同。数据之间的相似性是通过定义一个距离或者相似性系数来判别的。二、聚类、分类区别分类分类聚类是一种有监督式的学习过程是一种无监督式的学...

数学建模系列-评价模型(三)---聚类分析法

Caiersaru的博客

09-21

654

聚类分析法是一种特殊的方法，主要是把其他的几个目标分为一类。 聚类分析的方法可以参考我们前面讲过的最小二乘法，也基本上是对于经典发的一种补充，可以放在前面对参数进行聚类分析，也可以放在后面对结果进行积累分析（相当于模糊或者纸和笔第二步）这里也可以简单的用进化二乘等、卡尔曼滤波直接进行分类。这篇博文里提到了进阶版的聚类分析 原文链接：https://blog.csdn.net/weixin_45870904/article/details/113817808 ...

聚类模型ari_7.9 聚类模型评估

weixin_33375514的博客

01-14

950

如果有了类别标签，那么聚类结果也可以像分类那样计算准确率和召回率。但是不应该将分类标签作为聚类结果的评价指标，除非你有相关的先验知识或某种假设，知道这种分类类内差距更小。但是它还是给出了几种评价标准。7.9.1 调整兰德系数 (Adjusted Rand index)1. 数学原理兰德系数(Rand index)需要给定实际类别信息C，假设K是聚类结果，a表示在C与K中都是同类别的元素对数，b表示...

聚类问题的 5 种评估手段，总有一种你不知道的！附代码实现

数据森麟

01-29

2416

分类/回归/聚类——模型评估

qq_42012732的博客

07-15

2544

模型评估1. 基本概念2. 分类模型评估2.1 混淆矩阵2.2 准确率（Accuracy）2.3 精确率（Precision）2.4 召回率（Recall）2.5 P-R（Precision-Recall）曲线2.6 F1 Score2.7 ROC曲线2.8 AUC(area-under-curve)3. 回归模型评估3.1 均方误差（MSE）3.2 均方根误差（RMSE）3.3 平均绝对百分比误差（MAPE）3.4 平均绝对误差（MAE）3.5 对称平均绝对百分比误差（SMAPE）3.6 可决系数（R-S

机器学习：聚类分析详解与应用

"机器学习-聚类分析.pdf"是一份...总结来说，这份文档详细介绍了机器学习中的聚类分析技术，从理论基础到具体算法，再到评估标准，为读者提供了全面的指导，适用于希望深入理解聚类分析并在实际项目中运用的技术人员。