SOM(自组织映射图)-CSDN博客

本文链接：https://blog.csdn.net/qq_40844444/article/details/143812617

自组织映射图（Self-Organizing Map，简称SOM）是一种无监督学习算法，主要用于数据的降维和可视化。下面是对自组织映射图的详细解释：

基本概念

神经网络结构

节点（Neurons）：SOM由一系列节点组成，每个节点都有一个权重向量（weight vector），其维度与输入数据的维度相同。
网格拓扑（Grid Topology）：节点通常按照一定的拓扑结构排列，如一维线、二维平面或更高维的结构。最常见的是二维网格。

学习过程

初始化

在开始训练之前，SOM的权重向量需要被随机初始化或者根据某些启发式方法初始化。

训练迭代

数据呈现：在每次迭代中，从数据集中随机选取一个数据点。
竞争：计算输入数据点与所有节点权重向量之间的相似度（通常是欧几里得距离），找到最相似的节点，这个节点被称为最佳匹配单元（Best Matching Unit，BMU）。
协同作用（邻域函数）：确定BMU的邻域，邻域的大小会随着训练的进行而逐渐减小。邻域内的节点权重将得到更新。
适应（学习）：调整BMU及其邻域节点的权重向量，使其更接近输入数据点。学习率（learning rate）决定了权重调整的幅度，并随着时间逐渐减小。
迭代：重复上述步骤，直到权重向量稳定或者达到预设的迭代次数。

训练参数

学习率（Learning Rate）：初始时较大，随着训练的进行逐渐减小。
邻域半径（Neighborhood Radius）：初始时较大，随着训练的进行逐渐减小。
邻域函数（Neighborhood Function）：通常使用高斯函数来定义邻域，表示节点更新的影响力随距离增加而减小。

特性

拓扑排序：SOM能够保持输入数据的拓扑结构，即相似的输入数据在SOM上的映射位置也相近。
无监督学习：SOM不需要标注数据即可进行训练。
降维：将高维数据映射到低维空间，同时保持数据的重要结构。

应用

数据可视化：将高维数据映射到二维平面上，便于分析和理解。
聚类：SOM可以将数据点分组到不同的节点上，实现数据的聚类。
异常检测：识别那些没有映射到任何明显聚类的数据点。
特征映射：生成新的特征表示，用于进一步的数据分析或作为其他机器学习模型的输入。
模式识别：识别数据中的模式和结构。

限制

固定网格大小：网格的大小和形状是预先设定的，可能不适合所有数据集。
局部最优：SOM的训练可能会陷入局部最优。
计算成本：对于大型数据集，SOM的训练计算成本较高。

训练步骤示例

初始化：设定网格大小，随机初始化权重向量。
选择一个输入数据向量。
计算输入向量与所有权重向量的距离，找到BMU。
更新BMU及其邻域内的权重向量：
- 对于邻域内的每个节点，根据邻域函数调整权重向量：
  [ w_{new} = w_{old} + \alpha(t) \cdot h(d, t) \cdot (x - w_{old}) ]
  其中，( w ) 是权重向量，( \alpha(t) ) 是时间( t )的学习率，( h(d, t) ) 是邻域函数，( d ) 是BMU与节点之间的距离，( x ) 是输入向量。
重复步骤2-4，直到满足停止条件。
通过这种方式，SOM能够有效地将高维数据结构映射到一个低维空间，同时保持原始数据的拓扑特性。

下面我将提供一个简单的自组织映射（SOM）的Python代码实现。这个例子使用的是二维网格，并假设输入数据是二维的。我们将使用numpy来处理矩阵运算。
首先，确保你已经安装了numpy库。如果没有，可以通过以下命令安装：

pip install numpy

以下是SOM的代码实现：

import numpy as np
class SOM:
    def __init__(self, width, height, input_dim, sigma=1.0, learning_rate=0.5, decay_function=None, decay_rate=1):
        self.width = width
        self.height = height
        self.input_dim = input_dim
        self.weights = np.random.rand(width, height, input_dim)
        self.sigma = sigma
        self.learning_rate = learning_rate
        self.decay_function = decay_function or (lambda x, t, max_iter: x / (1 + decay_rate * t / max_iter))
        self.iteration = 0
        self.max_iterations = 1000
    def _find_bmu(self, input_vector):
        distances = np.linalg.norm(self.weights - input_vector, axis=2)
        return np.unravel_index(distances.argmin(), distances.shape)
    def _update_weights(self, input_vector, bmu, sigma, learning_rate):
        for x in range(self.weights.shape[0]):
            for y in range(self.weights.shape[1]):
                distance = np.linalg.norm(np.array([x, y]) - np.array(bmu))
                if distance < sigma:
                    influence = np.exp(-distance**2 / (2 * (sigma**2)))
                    self.weights[x, y, :] += influence * learning_rate * (input_vector - self.weights[x, y, :])
    def train(self, data):
        self.iteration = 0
        for self.iteration in range(self.max_iterations):
            for input_vector in data:
                bmu = self._find_bmu(input_vector)
                learning_rate = self.decay_function(self.learning_rate, self.iteration, self.max_iterations)
                sigma = self.decay_function(self.sigma, self.iteration, self.max_iterations)
                self._update_weights(input_vector, bmu, sigma, learning_rate)
    def get_winner(self, input_vector):
        distances = np.linalg.norm(self.weights - input_vector, axis=2)
        return np.unravel_index(distances.argmin(), distances.shape)
# 示例使用
# 创建一个SOM实例
som = SOM(width=10, height=10, input_dim=3)
# 假设有一些二维输入数据
data = np.random.rand(100, 3)
# 训练SOM
som.train(data)
# 获取一个输入向量的获胜节点
winner = som.get_winner(data[0])
print(f"Winner coordinates: {winner}")

这个简单的SOM实现包含了以下部分：

初始化：初始化SOM的权重，设定网格大小、学习率、sigma值和衰减函数。
寻找BMU：在训练过程中，为每个输入向量找到最佳匹配单元（BMU）。
更新权重：根据输入向量和BMU的位置更新SOM的权重。
训练：通过迭代过程训练SOM，逐渐减少学习率和sigma值。
获取获胜节点：对于给定的输入向量，找到获胜节点。
请注意，这个代码是一个非常基础的SOM实现，用于教学目的。在实际应用中，你可能需要更复杂的SOM实现，它可能包括更多的优化和功能，比如更复杂的衰减函数、不同类型的网格拓扑、并行计算等。