算法评估：聚类

最新推荐文章于 2024-06-27 17:45:24 发布

picoasis

最新推荐文章于 2024-06-27 17:45:24 发布

阅读量195

点赞数

分类专栏：机器学习测试数据分析文章标签：聚类算法评估样本差异

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lamanchas/article/details/121646169

版权

测试同时被 3 个专栏收录

5 篇文章 3 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

本文介绍了聚类算法的评估方法，包括间接法和直接法，如外部指标和内部指标。直接法中，样本差异通过相似性计算来衡量，常见的距离度量有欧式距离和余弦距离。欧式距离在标准化数据后使用，而余弦距离不受指标单位影响。这些评估标准对于优化聚类算法和理解数据集的内在结构至关重要。

摘要由CSDN通过智能技术生成

文中图片来自华为云课堂视频截图https://education.huaweicloud.com/courses/course-v1:HuaweiX+CBUCNXE086+Self-paced/courseware/c2ea05f2357c443eacf554f37aa2e6a7/75a7a0b27849445db209b25109668451/

目录

如何评估聚类算法

相似性计算——如何评估样本之间的差异

如何评估聚类算法

间接法：对使用聚类算法结果的下一应用的指标进行评估

直接法：外部指标（聚类结果和某个参考模型比较，将计算机结果与行业专家划分结果比较），内部指标（类内差异尽可能小，类间差异尽可能大 ）

直接法需要计算类内样本点、类外样本点间的样本差异。

那么样本差异，要如何衡量呢？

样本差异，常借助’相似性‘指标衡量。

相似性计算——如何评估样本之间的差异

簇内样本差异小，簇外样本样本差异大。

使用样本点间的距离衡量样本差异。

在这里，有两种常用距离：

欧式距离：向量的模值
- 会受指标单位刻度影响，需要先对数据标准化处理eg：min-max [0,1]，
- 欧氏距离越大，差异越大
余弦距离：向量的夹角——兴趣推荐
- 不受指标刻度的影响
- 值越大，差异越小

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

picoasis

CSDN认证博客专家 CSDN认证企业博客

码龄12年

170: 原创

1万+: 周排名

7539: 总排名

61万+: 访问

: 等级

4251: 积分

788: 粉丝

475: 获赞

159: 评论

2999: 收藏

私信

关注

热门文章

分类专栏

最新评论

CANbedded组件功能简介
浪矢杂货铺: 博主，您好，您那有GENy软件吗？可以接受有偿
CAN：SRR位有什么用
踏雪夜行: 先提出问题（SRR是啥），然后从协议规范中找到说明（永远置1，无实际意义），进而提出新的问题（为啥引入一个无意义的位？），然后从仲裁的角度（数据帧与遥控帧，标准帧与扩展帧）说明这一位的实际意义（保证数据帧优先于遥控帧）。按照思考的顺序循序渐进，层层剥析，最后得到根本原因，豁然开朗。很好！
CAN-位时间与同步-1
汉武大东: 情况1中的（1），如果发送节点Node A在后的话，难道不是A时间快了吗？比如A的时间是在6s发的，而在接收节点的时间戳来看，是在5s收的，那么B这个接收节点就要延长PBS2，使得A发送完成的时间和B接收完成的时间一致，达到同步的目的
capl通过message.id匹配不到数据
picoasis: 哇~大佬现身！还没验证，有个思路，先通过监听报文，识别扩展帧id的数据类型；有可能是长整型，string型,，byte数组型，data型？；然后使用对应类型的变量表示这个id。
CANoe-第2个仿真工程-XVehicle1总线数据库设计（操作）
2401_84827694: 你好，新建一个名为Engine的网络节点，并且将节点的地址设为0x1，在这个过程中，节点地址灰色了显示00不能修改是怎么回事呢？

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

picoasis 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。