聚类算法分析
非监督学习中,聚类作为很关键的部分,所以主要分析常用聚类算法以及最新出现的聚类算法
eternity1118_
不积跬步无以至千里,不积小流无以成江海
展开
-
运动跟踪算法CMT(续)之层次凝聚聚类算法(HAC)
熟悉CMT的都知道,作者在聚类部分使用了层次凝聚聚类算法(Hierarchical Agglomerative Clustering)并且使用的是单链(Single-link),今天我们就来学习下这个算法。 前面学习了几种聚类算法,K-Means,EM,AP等都属于平面聚类(Flat Clustering),因为这些算法的输出都是返回一个平面的无结构的聚类集合,所以叫做Flat c原创 2016-05-28 23:23:25 · 4763 阅读 · 0 评论 -
软分类和硬分类
在统计学习中,有两种模型:概率模型和非概率模型;概率模型:形式为P(x|y),即在学习过程中,y未知,训练后模型得到的输出是x的一系列值的概率;非概率模型:形式为决策函数,即输入x到输出y的一个映射,且输出唯一;软分类:使用的是概率模型,输出不同类对应的概率,最后的分类结果取概率最大的类,如多SVM组合分类;硬分类:使用的是非概率模型,分类结果就是决策函数的决策结果;原创 2016-05-28 17:11:14 · 6815 阅读 · 2 评论 -
吸引子传播(Affinity Propagation)算法
AP算法诞生于2007年,由于其算法的简单性以及性能的优越性,得以广泛应用,成为K-Means外的又一大常用聚类算法;K-Means聚类自身的缺陷在于要人为选取聚类数量以及初始点,算法的性能也完全依赖于上述选择,与K-Means相比,AP避免了此类人工选择,将数据点对之间的相似性度量作为输入,它的核心在于“message passing信息传播”,主要目的为了找到一个样例的典型,即能够表示原创 2016-05-27 21:26:20 · 7381 阅读 · 3 评论 -
EM(期望最大化)聚类详细推导
1.简介 在讲EM之前,不知道大家还记不记得GMM算法,这个算法本质上也是一种聚类算法,而且GMM的求解正是利用本篇所讲的EM聚类来得到高斯分量的。 上篇提到了K-Means聚类,尽管这个算法很常用,但可能会遇到像聚类重叠,或聚类的形状不是圆形等问题;今天来学习一个新的聚类算法,叫EM聚类,这个算法本质上来说跟K-Means很像,但比K-Means全面更深入的描述一原创 2016-05-27 16:16:41 · 12578 阅读 · 0 评论 -
K-Means聚类算法
本文系翻译(原文),必要时揉入了自己的理解,各位看官,如有错误还望多多包涵。1.引言 前面说过,机器学习是一门处理数据的学科,计算机发展至今,也诞生了数不胜数的跟数据有关的智能算法,正因为这些算法才让那些从事数据分析和处理的人们得以发挥自己的聪明才智。这些算法表面上看似极其复杂无比,但是如果你有心将它们一一整理并且深入的理解,那么在你需要时,你会发现找到一个适合的算法应用到你的翻译 2016-05-27 12:59:06 · 4644 阅读 · 0 评论