![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
聚类算法
文章平均质量分 95
人鱼线
1、越努力,越幸运! 2、机会总是留给有准备的人! 3、承受别人不能承受的,才能得到别人不能得到的!
展开
-
02. 聚类算法 - 相似度距离公式、维度灾难
聚类就是对大量未知标注的数据集,按照数据内部存在的数据特征将数据集划分为多个不同的类别,使类别内的数据比较相似,类别之间的数据相似度比较小。聚类算法的重点是计算样本项之间的相似度,有时候也称为样本间的距离。PS: 补充一个维度灾难的概念数据维度高,数据量大,这种时候样本在空间中比较密集,这种情况不太好划分。只有当数据相对比较松散的时候,才能做到有效的聚类分析。维度高,数据量大的时候...原创 2019-10-23 22:12:58 · 1436 阅读 · 0 评论 -
01. 聚类算法-大纲
本章开始进入聚类算法(Cluster)的讲解。 之前讲过的内容都是针对有监督学习的模型,即我们在分类之前知道最终分类的目标。而聚类算法是面向无监督学习的一种建模思想。聚类就是对大量未知标注的数据集,按照数据内部存在的数据特征将数据集划分为多个不同的类别,使类别内的数据比较相似,类别之间的数据相似度比较小;属于无监督学习。聚类算法的重点是计算样本项之间的相似度,有时候也称为样本间的距离。...原创 2019-10-23 22:12:24 · 560 阅读 · 0 评论 -
聚类算法 - K-Means、二分K-Means、K-Means 、K-Means||、Canopy、Mini Batch K-Means算法
K-Means 系列:K-Means,二分K-Means,K-Means++,K-Meansll,canopy算法,MiniBatchK-Means算法。K-Means系列聚类算法原理:https://www.cnblogs.com/pinard/p/6164214.html用scikit-learn学习K-Means聚类:https://www.cnblogs.com/pinar...原创 2020-04-14 13:22:01 · 2900 阅读 · 1 评论