Self-organizing Map详解

最新推荐文章于 2023-10-15 16:52:33 发布

VIP文章 Leon1895

最新推荐文章于 2023-10-15 16:52:33 发布

阅读量1.2w

点赞数 3

分类专栏：机器学习文章标签： SOM 自组织映射聚类

本文链接：https://blog.csdn.net/qq_40793975/article/details/82689955

版权

Self-organizing Map详解

第二十一次写博客，本人数学基础不是太好，如果有幸能得到读者指正，感激不尽，希望能借此机会向大家学习。这一篇文章是原型聚类中介绍的第五个算法，主要是谈一谈“自组织映射”（Self-organizing Map）。其他有关于原型聚类算法的讨论可以移步到该类算法的导航页《原型聚类算法综述（原型聚类算法开篇）》。

Self-organizing Map（自组织映射）

自组织（特征）映射（Self-organizing Map，简称SOM），是一种基于神经网络的聚类和数据可视化算法。这种算法将含有 $n$ 维向量样本的数据集 $D=\{\mathbf{x}_i|i=1,2,...,m\}$ 作为输入，在保证原数据集样本点之间的拓扑结构不变的情况下，通过映射得到一个维度不高于 $n$ 的空间结构，这个空间结构中的每个点都含有一个权重向量（质心，在SOM中称为参考向量（Reference Vector），将权值向量作为质心的原因是，在映射过程中，样本点要与权值向量进行点积，这种点积运算可以看做是计算两个向量之间的余弦相似度）作为映射参数，因此，SOM也可以看做是原数据集中样本点的非线性回归或者类似于PCA的一种特征缩放的过程。其中，最终得到的空间结构（地形序（Topographic Ordering））由设计者根据SOM算法的使用环境自行定义，一般为了满足数据可视化目的，将其设置为二维空间中的矩阵结构，如下图所示是一个二维空间下的3x3矩形SOM拓扑结构

虽然同样是对每个样本进行簇指派，并且更新质心，但是与K-Means等基于原型的聚类算法仍有很大的区别，SOM中的质心由于自定义空间结构的影响，而具有预先确定的地形序关系，因此，在质心（参考向量）更新过程中需要考虑与样本点最近的质心（参考向量）及其临近的质心（参考向量）进行增量更新，且更新过程中不记录每个样本隶属的质心（参考向量），在更新完成后，再根据这些质心（参考向量）来分配数据集中的样本到对应的质心（参考向量）中。

SOM训练过程

SOM的训练过程分为初始化质心、随机选取对象、对象的指派和质心的更新，伪代码如下所示

最低0.47元/天解锁文章

Leon1895

关注

3
点赞
踩
25

收藏

觉得还不错? 一键收藏
2
评论
Self-organizing Map详解

Self-organizing Map详解第二十一次写博客，本人数学基础不是太好，如果有幸能得到读者指正，感激不尽，希望能借此机会向大家学习。这一篇文章是原型聚类中介绍的第五个算法，主要是谈一谈“自组织映射”（Self-organizing&amp;nbsp;&amp;nbsp;\ Map）。其他有关于原型聚类算法的讨论可以移步到该类算法的导航页《原型聚类算法综述（原型聚类算法开篇）》。Self-...
复制链接

扫一扫