从ANN到SNN的转换：实现、原理及两种归一化方法【MINIST、实战】

修炼室

已于 2024-10-15 19:33:44 修改

阅读量2.7k

点赞数 36

分类专栏： AI 文章标签：机器学习深度学习人工智能

于 2024-09-15 21:25:54 首次发布

本文链接：https://blog.csdn.net/qq_22841387/article/details/142288951

版权

从ANN到SNN的转换：实现、原理及两种归一化方法

引言

随着神经形态计算的迅猛发展，脉冲神经网络（Spiking Neural Networks, SNNs）作为一种仿生神经计算模型，逐渐展现出其在低功耗和事件驱动计算领域的巨大潜力。不同于传统的人工神经网络（Artificial Neural Networks, ANNs），SNN通过二值化的脉冲信号进行信息传递，从而更接近生物神经元的行为。其离散时间、事件触发的处理模式使得SNN在能效和计算效率上具有天然的优势，尤其在神经形态硬件上更为适合。

尽管SNN具备诸多优点，但由于脉冲神经元的异质性以及神经元发放模式的离散性，直接训练SNN模型存在较大挑战。为此，基于ANN到SNN的转换方法成为了当前热门的研究方向。通过将预先训练好的ANN转换为SNN，研究人员能够在保留ANN性能的前提下，充分利用SNN的能效优势。本文将介绍如何通过一套系统的方法实现ANN到SNN的转换，并深入探讨两种归一化方法：MaxNorm和RobustNorm，帮助我们更好地理解这一过程的细节。

1. ANN2SNN转换概述

1.1 ANN与SNN的核心差异

人工神经网络（ANN） 中的神经元采用连续的激活函数，如ReLU、Sigmoid或Tanh等，激活值可以是任意实数。这种方式虽然能够实现复杂的非线性映射，但其计算能耗较高，且不具备生物神经元的事件驱动特性。

脉冲神经网络（SNN） 的工作原理与ANN有显著区别。SNN的神经元使用脉冲（spike）作为信息载体，激活方式通过离散脉冲的形式表现。每个神经元的发放过程是基于输入电压的累积，当累积的电压达到某个阈值时，神经元会“发放”脉冲信号。SNN中的常见神经元模型包括：

积分发放神经元（Integrate-and-Fire, IF Neuron）：IF神经元通过累积输入电压，当电压超过阈值时，神经元发放脉冲，随后电压重置为初始值。
泄露积分发放神经元（Leaky Integrate-and-Fire, LIF Neuron）：在IF模型的基础上增加了泄露机制，使得神经元的电压在没有持续输入时会随时间衰减，更加接近生物神经元的动态特性。

由于ANN和SNN在信息传递机制上的本质差异，直接将ANN的权重应用于SNN是不可行的。因此，在实现ANN到SNN的转换时，需要对神经元的行为和模型的结构进行调整。具体来说，主要挑战在于如何将ANN中的连续激活值有效地映射到SNN中的脉冲发放行为上。

1.2 ANN2SNN的转换流程

ANN到SNN的转换是一个系统化的过程，核心步骤包括训练ANN、激活值归一化处理以及神经元替换。整个流程可概括为以下五个步骤：

训练ANN模型：首先使用标准的机器学习框架（如PyTorch、TensorFlow）训练一个高性能的ANN模型。通常采用卷积神经网络（CNN）架构，在任务（如图像分类）上进行训练。
激活值记录：在ANN的训练过程中，插入电压钩子（Voltage Hook）以记录每层网络的激活值。这一步的目的是获取每层神经元的激活范围，便于后续的归一化处理。
归一化处理：对每层神经元的激活值进行归一化，确保ANN中的权重在SNN中依然能产生合理的神经元发放行为。最常用的两种归一化方法是基于最大值的MaxNorm和基于分位数的RobustNorm。
替换为脉冲神经元：将ANN中的连续激活函数（如ReLU）替换为SNN中的脉冲神经元（如IF或LIF神经元），并应用归一化系数对输入电压进行缩放。
SNN仿真与验证：在多步时间仿真下运行SNN模型，并在特定任务（如图像分类）上验证SNN的性能。

2. 两种归一化方法

归一化处理是ANN2SNN转换中的关键步骤。
在这里插入图片描述

可以发现，两者的曲线几乎一致。需要注意的是，脉冲频率不可能高于1，因此IF神经元无法拟合ANN中ReLU的输入大于1的情况。

由于SNN神经元的发放特性不同于ANN中的连续激活函数，为了保证模型在转换后的SNN中依旧具有良好的表现，需要对输入的电压或电流进行适当的缩放。本文讨论了两种归一化方法：MaxNorm和RobustNorm。

2.1 MaxNorm归一化

MaxNorm是最简单的归一化方式，适用于没有大量噪声或异常激活值的数据。该方法的核心思想是将每层神经元的输入电压缩放到其激活值的最大范围内，以确保神经元能够有效发放脉冲。

激活值的最大值收集：遍历训练数据集，记录每一层ReLU激活的最大值（ $s_{max}$ ）。
转换为SNN：替换ReLU层为IF神经元，激活值通过一个比例缩放：
$\text{输入} = \frac{\text{输入}}{s_{max}} \quad \text{输出} = \text{输出} \times s_{max}$
即，输入电压缩放为 $1/s_{max}$ ，IF神经元发放脉冲后，再将输出电压放大回 $s_{max}$ 。

这种归一化方法的优点在于简单高效，尤其是在输入数据比较规整、没有极端异常值的情况下，能够较好地保持ANN模型的性能。

代码示例：

model._modules[name] = nn.Sequential(
    VoltageScaler(1.0 / max_item),    # 缩放输入
    neuron.IFNode(v_threshold=1., v_reset=None),    # IF神经元
    VoltageScaler(max_item)    # 恢复输出
)

2.2 RobustNorm归一化

RobustNorm归一化是一种更加稳健的归一化策略，特别适用于数据中可能包含噪声或异常激活值的情况。与MaxNorm不同，RobustNorm不直接使用最大值进行归一化，而是使用激活值的某个高分位数（如99.9%）来确定归一化系数。
在这里插入图片描述

这种方法减少了极端激活值对归一化过程的影响，确保模型在数据分布复杂或含有噪声的情况下能够保持性能。

激活值的分位数收集：遍历训练数据集，记录每一层ReLU激活的某个高分位数（如99.9%）。
归一化权重和偏置：在替换神经元之前，对权重和偏置进行缩放，确保层与层之间的比例一致。
转换为SNN：类似MaxNorm，将激活值进行分位数缩放。

这种方法通过调整每一层的权重，进一步优化了层间的信息传递，减少了转换过程中精度的损失。

代码示例：

# 在替换神经元之前，调整权重
if self.prev_scale is not None:
    current_scale = max_item
    prev_scale = self.prev_scale
    module.weight.data = module.weight.data * (prev_scale / current_scale)
    if hasattr(module, 'bias') and module.bias is not None:
        module.bias.data = module.bias.data * (prev_scale / current_scale)
self.prev_scale = max_item

3. 实现流程

在代码中，首先训练了一个具有较好精度的卷积神经网络（CNN）模型。随后使用VoltageHook来遍历训练数据，收集激活值的范围。根据收集到的最大激活值或分位数，进行归一化并替换成SNN中的IF神经元。

接下来详细解释代码中几个关键模块的功能，包括VoltageHook、VoltageScaler、Converter等。

3.1 `VoltageHook`类

VoltageHook是一个自定义层，用于记录ANN中每一层的激活值。这个激活值在SNN中用于归一化（scaling）。在ANN的ReLU激活后，我们需要知道激活值的范围，以便后续归一化。

scale：保存激活层的尺度，用于后续的SNN模型归一化。
mode：决定使用最大值（MaxNorm）还是分位数（RobustNorm）来记录激活值。

class VoltageHook(nn.Module):
    def __init__(self, scale=1.0, mode='Max'):
        """
        确定在ANN推理中激活的范围。
        """
        super().__init__

最低0.47元/天解锁文章

从ANN到SNN的转换：实现、原理及两种归一化方法【MINIST、实战】

从ANN到SNN的转换：实现、原理及两种归一化方法

引言

1. ANN2SNN转换概述

1.1 ANN与SNN的核心差异

1.2 ANN2SNN的转换流程

2. 两种归一化方法

2.1 MaxNorm归一化

代码示例：

2.2 RobustNorm归一化

代码示例：

3. 实现流程

3.1 VoltageHook类

3.1 `VoltageHook`类