自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

静子的杂谈

机器学习相关学习笔记,希望大家批评指正,谢谢

  • 博客(8)
  • 收藏
  • 关注

原创 Multi-Exemplar Affinity Propagation

相比传统聚类算法,Affinity Propagation Clustering(AP算法)的优势在于:1)、对初值不敏感(严格说AP中需要人工设定的初值包括preference和为了减少震荡引入的参数lamda,其中前者的大小决定了最终的类别数多少,后者决定了收敛速度。)2、聚类性能和效率大幅度提升。然后AP属于single-exemplar based 方法,即一个cluster中只有一个ex

2013-10-10 08:18:45 1915

原创 聚类(6)-- Affinity Propagation Clustering

Affinity Propagation Clustering(吸引力传播聚类,简称AP算法)是2007在Science上发表的一篇single-exemplar-based的聚类方面的文章。特别适合高维、多类数据快速聚类,相比传统的聚类算法,从聚类性能和效率方面都有大幅度的提升,下文将详细介绍AP算法。 对于个数据点的聚类问题,设定数据点为x(i),i= 1,2,...,N。吸引力传播聚类

2013-10-10 07:24:35 7525

原创 聚类(5)-- Spectral clustering

Spectral clustering (谱聚类)是一种比较现代的聚类方法,基于图的分割(Graph cut)。不同于k-means需要数据点分布在N维欧式空间,谱聚类只需要知道数据点之间的相似性矩阵,就可进行运算,而不需要数据必须来自欧式空间。 谱聚类通过对于由数据相似性矩阵出发构造的数据Laplacian矩阵进行谱分解,实现数据降维,即实现在新的低维特征空间中,数据可分度提高。 维基百

2013-10-09 15:11:56 1845

原创 聚类(4)-- Hierarchical clustering

前面谈到的聚类算法,最终输出的结果都是被被称为“flat”的,即平坦的,然后存在这样的情况,即数据集中是有层次的。例如,待分类的数据是3个家庭的成员,其中可能包括爷爷,奶奶,爸爸,妈妈,儿子,女儿。不同的家庭最终会形成一个树结构(这个例子可能不太合适,但是大概能说明问题,嘻嘻),在这种情况下,使用“flat”类型的聚类算法,例如k-means则无法揭示数据之间的层次关系,于是Hierarchica

2013-10-09 12:33:10 1606

原创 聚类(3)-- Gaussian Mixtures Model

Gaussian Mistures Model(GMM) 假设数据集服从混合高斯分布(Mixture Gaussian Distribution),即认为整个数据集是由若干个高斯分布(每个高斯分布分别代表一个component)混合而成的,通过估计每个component的模型参数(均值和协方差),实现数据集密度估计以及将数据点以一定概率归属于某参数所代表的的高斯分布中,实现clustering。与

2013-10-09 09:06:44 1216

原创 聚类(2)-- Fuzzy k-means clustering

在传统的k-means聚类算法的每步迭代中,每个数据点被硬划分到一个cluster。Fuzzy k-means试图松弛上述条件,即认为每个数据点与cluster center之间的membership不是取自{0,1},而是[0,1],而上述membership就是当前数据点属于一个cluster center所代表的cluster的概率。 Fuzzy k-means聚类算法试图最小化如下cos

2013-10-09 07:17:02 2132

原创 聚类(1)-- k-means clustering

作为一种无监督数据分析技术,聚类算法不需要提供导师信息,通过数据间的统计相关特性,采用迭代等方法实现相比不同cluster内部数据点间的相似程度,相同cluster数据点之间的相似性更高。 作为最传统的聚类算法,k-means试图迭代计算一组聚类中心,使得在欧氏距离下,所有数据点到各自所在cluster的聚类中心的距离和最小,也就是使得within-cluster scatter mat

2013-10-09 07:15:37 1598

转载 Scatter matrix, correlation matrix and covariance matrix

Basically, all of these matrices are calculated using the same procedure:ATA.The only difference between them is how the data is scaled before the matrixmultiplication is executed:  scatter matrix:

2013-10-09 07:13:43 2593

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除