Kohonen Self Organize Maps(SOM) 是其中一种神经网络的方法,用于聚类分析,它通过自相竞争(Self-competition)的方式实现聚类过程,对于每个维度赋予权重,通过多次迭代,最终达到收敛。SOM能够自动确定K值,因此不需要像K-means一样事先确定K。一般来说,SOM对维度高的数据集表现更好。
SOM映射高纬度的数据集到低纬度空间中,因此可以用于降低维度。
SOM实现步骤如下:
1.设立神经元网格和初始参数
2.选择随机的input
3.神经元之间进行竞争
4.调整input以及权重
5.重复上述步骤直至达到收敛
优点:
1.可以在一开始通过调整参数优化学习速度
2.不需要事先确定K值
3.可以降低维度
缺点:对初始参数比较敏感,初始参数的好坏直接影响收敛速度
上图是SOM收敛过程的简单示意图,红色点为输入数据,绿色和蓝色正方形是两个神经元,通过不断迭代计算,两个神经元竞争得到数据点,最后达到收敛,从而实现分类。也有可能有一些神经元连一个数据点都竞争不到(图中没有显示,可以想象成图中有另外其他颜色的正方形神经元,但是并没有点向其靠拢)。