Self-organizing Map详解

Self-organizing Map详解

第二十一次写博客,本人数学基础不是太好,如果有幸能得到读者指正,感激不尽,希望能借此机会向大家学习。这一篇文章是原型聚类中介绍的第五个算法,主要是谈一谈“自组织映射”(Self-organizing Map)。其他有关于原型聚类算法的讨论可以移步到该类算法的导航页《原型聚类算法综述(原型聚类算法开篇)》

Self-organizing Map(自组织映射)

  自组织(特征)映射(Self-organizing Map,简称SOM),是一种基于神经网络的聚类和数据可视化算法。这种算法将含有 n n n维向量样本的数据集 D = { x i ∣ i = 1 , 2 , . . . , m } D=\{\mathbf{x}_i|i=1,2,...,m\} D={ xii=1,2,...,m}作为输入,在保证原数据集样本点之间的拓扑结构不变的情况下,通过映射得到一个维度不高于 n n n的空间结构,这个空间结构中的每个点都含有一个权重向量(质心,在SOM中称为参考向量(Reference Vector),将权值向量作为质心的原因是,在映射过程中,样本点要与权值向量进行点积,这种点积运算可以看做是计算两个向量之间的余弦相似度)作为映射参数,因此,SOM也可以看做是原数据集中样本点的非线性回归或者类似于PCA的一种特征缩放的过程。其中,最终得到的空间结构(地形序(Topographic Ordering))由设计者根据SOM算法的使用环境自行定义,一般为了满足数据可视化目的,将其设置为二维空间中的矩阵结构,如下图所示是一个二维空间下的3x3矩形SOM拓扑结构

  虽然同样是对每个样本进行簇指派,并且更新质心,但是与K-Means等基于原型的聚类算法仍有很大的区别,SOM中的质心由于自定义空间结构的影响,而具有预先确定的地形序关系,因此,在质心(参考向量)更新过程中需要考虑与样本点最近的质心(参考向量)及其临近的质心(参考向量)进行增量更新,且更新过程中不记录每个样本隶属的质心(参考向量),在更新完成后,再根据这些质心(参考向量)来分配数据集中的样本到对应的质心(参考向量)中。

SOM训练过程

SOM的训练过程分为初始化质心、随机选取对象、对象的指派和质心的更新,伪代码如下所示

  • 3
    点赞
  • 25
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值