机器学习聚类算法简介

最新推荐文章于 2024-07-02 10:45:45 发布

Glory_g

最新推荐文章于 2024-07-02 10:45:45 发布

阅读量1.1k

点赞数

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhelong3205/article/details/78682624

版权

本文介绍了聚类算法在无监督学习中的应用，旨在揭示数据的内在结构。聚类算法评估涉及外部指标如准确率和内部指标，以及距离计算如欧几里得距离和曼哈顿距离。

摘要由CSDN通过智能技术生成

算法的目的：

聚类算法是“无监督学习”中最常用的一个算法，通过对无标记训练样本的学习将数据集划分成若干个不相交的子集，来解释数据的内在性质以及规律，为进一步数据分析提供基础。也可以作为一个单独的过程，寻找数据内在的分布结构

注意：类所对应的概念语义需要由使用者自己把握和命名。

对于一个算法的评估我们需要对这种算法进行量化，比如手对于一般的基础算法，我们有时间复杂度、空间复杂度进行度量，对于监督学习我们用答对率和预测误差进行度量，当然聚类算法也需要一个数值化的方法对其性能进行度量

算法的性能度量

度量分为两种方法，一个是依赖外部的某个“参考模型”经行比较，成为 “外部指标”，另一个是直接参考聚类的结果而不是参考其他模型，称之为“内部指标”。

1.外部指标

这里写图片描述

这里写图片描述

外部指标一

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习聚类算法简介

算法的目的：聚类算法是“无监督学习”中最常用的一个算法，通过对无标记训练样本的学习将数据集划分成若干个不相交的子集，来解释数据的内在性质以及规律，为进一步数据分析提供基础。也可以作为一个单独的过程，寻找数据内在的分布结构注意：类所对应的概念语义需要由使用者自己把握和命名。对于一个算法的评估我们需要对这种算法进行量化，比如手对于一般的基础算法，我们有时间复杂度、空间复杂度进行度量，对于监督学习我
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。