![](https://img-blog.csdnimg.cn/20190927151043371.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
无监督—聚类
主要介绍聚类相关算法和工程
TigerZ*
计算机视觉相关。接付费咨询开发。
算法:AIGC、分类、检测、特征、长尾、开集、聚类、传统图像算法。
语言:Python、C & C++。
工具:pytorch、TRT、CUDA、Triton、DeepStream、DALI。
展开
-
聚类路线图(算法选择)
一般实验选择sklearn包。需要从两个方面看。数据量和样本分布。建议看下面两个图和链接进行粗选。 一般实验选择sklearn包。需要从两个方面看。数据量和样本分布。建议看下面两个图和链接进行粗选。 链接:http://sklearn.apachecn.org/cn/0.19.0/modules/clustering.html#different-linkage-type-wa...原创 2018-11-20 14:40:09 · 1541 阅读 · 0 评论 -
聚类-综述
链接地址:https://yq.aliyun.com/articles/468110转载 2018-11-20 14:57:12 · 515 阅读 · 0 评论 -
Dpeak算法
基本假设:聚类中心周围都是密度比其低的点,同时这些点距离该聚类中心的距离相比于其他聚类中心来说是最近的。 密度最大值算法可以看成是基于kmeans和dbscan算法的一种拓展,主要优势在于确定簇中心和排除异常值。 首先给定一个半径范围r,然后对我们所有的样本,计算它的r邻域内的样本数目记作它的局部密度记作rho,第二步,计算每个样本到密度比它高的点的距离的最小值记作sigma,...原创 2018-11-20 11:28:13 · 1440 阅读 · 0 评论 -
OPTICS
OPTICS 就是一种基于密度的聚类算法,可以认为是dbscn的改进,改进之处主要是在不用每次调节eps和minpts都需要重新整个训练。其本质还是dbscan,只是能够在给定eps和minpts后,可以训练一次就可以在minpts值定对的情况下,尝试不同的eps’(eps’需要小于eps)来得到不同的结果。只不过由于算法需要,每个点得归属不是按照次序归为核心点,而是归为最近(如果距离小于...转载 2018-11-20 11:35:52 · 4866 阅读 · 1 评论 -
层次聚类
层次聚类(Hierarchical Clustering)是聚类算法的一种,通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。在聚类树中,不同类别的原始数据点是树的最低层,树的顶层是一个聚类的根节点。创建聚类树有自下而上合并和自上而下分裂两种方法。Hierarchical methods中比较新的算法有BIRCH(Balanced Iterative Reducing and ...原创 2018-11-20 11:36:28 · 1537 阅读 · 0 评论 -
DBSCAN
K-Means算法主要针对那种类圆形区域数据的聚类。而密度聚类可以弥补这个缺点,可用于任何形状的聚类。这个算法需要我们调节两个参数,半径sigma,最小数目m,先介绍该算法的一些概念。 核心对象:对于一个对象它的sigma领域内至少有m个对象,那我们就称之为核心对象。 直接密度可达:如果一个对象处在一个核心对象的sigma领域内,那称这两个对象直接密度可达。 密度...原创 2018-11-20 11:38:27 · 1049 阅读 · 0 评论 -
均值漂移聚类
均值漂移聚类是基于滑动窗口的算法,它试图找到数据点的密集区域。这是一个基于质心的算法,这意味着它的目标是定位每个组/类的中心点,通过将中心点的候选点更新为滑动窗口内点的均值来完成。然后,在后处理阶段对这些候选窗口进行过滤以消除近似重复,形成最终的中心点集及其相应的组。请看下面的图例。均值漂移聚类用于单个滑动窗口 为了解释均值漂移,我们将考虑二维空间中的一组点,如上...原创 2018-11-20 12:44:10 · 19541 阅读 · 11 评论 -
K-means系列
K-means 的缺点,及后续的改进方案。 依赖初始化,不同的初始化对应结果可能不同——k-means++; 需要制定K值,即聚类中心的个数——iosdata; 异常值敏感——k-medium; 聚类结果为超球体——kernel、GMMs。 海量数据——minibachk-means 原始k-means 1 初始选择K个类别中心。 ...原创 2018-11-20 12:45:28 · 1779 阅读 · 0 评论