机器学习（9）

最新推荐文章于 2024-06-14 10:39:52 发布

Mr. Morningstar

最新推荐文章于 2024-06-14 10:39:52 发布

阅读量242

点赞数

文章标签：机器学习聚类算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_46218732/article/details/125389223

版权

机器学习（9）------------------------------聚类

聚类

聚类任务	无监督学习中，训练样本通常没有标记，常用聚类寻找数据内部的规律聚类是将一个数据集划分为多个不相交的子集的过程，每一个子集称一簇（类）可作为单独过程，寻找内部规律可作为前驱过程，为后续训练模型打基础
性能度量（有效性指标）	目标：同簇相似，异簇不同用簇内相似度和簇间相似度来描述性能度量有两类：外部指标：将结果与某个参考模型比较内部指标：直接考察结果，不利于任何参考模型有 Jaccard系数、FM指数、Rand指数、DB指数、Dunn指数 DBI越小越好，DI越大越好
距离计算	距离度量满足以下性质：非负性、同一性、对称性、直递性常用闵可夫斯基距离属性可可划分为连续属性、离散属性离散属性可分为有序属性和无序属性闵可夫斯基距离适用于有序属性 VDM（Value Difference Metric）适用于无序属性相似度度量，距离越大，相似度越小
原型聚类	k均值法针对聚类所得簇划分最小化平方误差学习向量量化（LVQ）,假设样本带有类别标记，利用标记辅助聚类高斯混合聚类采用概率模型来表达聚类原型
密度聚类	有密度可达关系导出的最大密度相连样本集合
层次聚类	试图在不同层次对数据进行划分，从而形成属性的聚类结构可以自底向上、也可以自顶向下 AGNES是自底向上的一种算法

参考文献

周志华. 机器学习

Mr. Morningstar

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习（9）

机器学习（9）------------------------------聚类聚类聚类任务无监督学习中，训练样本通常没有标记，常用聚类寻找数据内部的规律聚类是将一个数据集划分为多个不相交的子集的过程，每一个子集称一簇（类）可作为单独过程，寻找内部规律可作为前驱过程，为后续训练模型打基础性能度量（有效性指标）目标：同簇相似，异簇不同用簇内相似度和簇间相似度来描述性能度量有两类：外部指标：将结果与某个参考模型比较内部指标：直接考察结果，不利于任何参考模型有Jaccard系数、FM指数、Rand指数、DB指数、D
复制链接

扫一扫

Mr. Morningstar CSDN认证博客专家 CSDN认证企业博客

码龄4年

13: 原创

59万+: 周排名

18万+: 总排名

4916: 访问

: 等级

133: 积分

3: 粉丝

3: 获赞

1: 评论

12: 收藏

私信

关注

热门文章

最新评论

Zotero论文格式去除DOI、链接、中英文可识别
CSDN-Ada助手: 恭喜您撰写了第13篇博客！标题中提到的去除DOI、链接以及中英文可识别的方法似乎非常实用。我相信这篇博客一定能帮助到很多人。感谢您持续不断地分享有价值的内容。对于下一步的创作建议，我想提出一点小建议。或许您可以考虑进一步探讨如何优化论文格式，以提高读者的阅读体验。例如，您可以分享一些关于如何排版论文以使其更易读、更具吸引力的技巧。这样的主题可能会引起更多读者的兴趣，同时也有助于提升他们的学术写作水平。再次恭喜您的努力和成果，期待您未来更多精彩的创作！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。