Stratified normalization: Using additional information to improve the neural network’s performance-CSDN博客

本篇文章主要是对讲解这个技术的博客进行解释+翻译，所以大部分是作者的原话

https://towardsdatascience.com/stratified-normalization-using-additional-information-to-improve-the-neural-networks-performance-f755021f0ae

原论文：https://www.frontiersin.org/journals/neuroscience/articles/10.3389/fnins.2021.626277/full?source=post_page-----f755021f0ae--------------------------------

在EEG脑成像方向上，有一个最具挑战性的问题:参与者的脑电图活动同质性差。这个问题可以清楚的在下图展示出来。我们使用UMP对EEG数据进行可视化分析。

在这里插入图片描述

在左边，颜色表示情绪;在右边，颜色表示数据对应的对象。我们发现一个人的情绪不论是积极的、消极的还是中性的情绪，都以人为单位集中分布，每个人的分布会很集中。因此，如果我们直接尝试使用一个经过训练的模型来对四个参与者的情绪进行分类，并试图推断第五个参与者的情绪，那么结果将非常糟糕。

为了解决这个问题，最常见的解决方案是使用校准阶段来预训练AI模型。然而，这是非常耗时的，所以许多研究人员一直在试图寻找替代解决方案。

尽管本文关注的是脑成像方法，但同样的问题也存在于许多其他领域，如图像识别、语音识别或面部表情。

在过去的几年里，已经有多位研究人员提出了解决这个问题的方法。对于脑成像，大多数提出的解决方案是基于选择鲁棒特征。然而，(1)使用这些特征训练的参与者独立模型的分类器性能仍然低于参与者依赖模型;(2)这些特征是任务相关的，这不仅阻碍了跨任务而且阻碍了跨领域的鲁棒解决方案。

因此，我们研究了一种新的基于参与者的归一化方法，称为分层归一化，用于训练深度神经网络。

该方法的主要思想是将附加信息按比例分配到神经网络中，以提高其性能。重要的是要提醒，这些附加信息必须与我们试图推断的信息不同。例如，在我们的数据集中，我们试图对情绪进行分类，因此使用的附加信息是每个数据的会话和参与者。

我们的分析是针对EEG信号的跨被试情绪分类任务，结果表明，使用分层归一化训练的网络明显优于使用批归一化的标准训练。

为了简要介绍我们的论文，我将重点介绍所提出的方法，并将其与众所周知的批归一化方法进行对比。此外，为了澄清解释，我将首先简要解释我用于分析的数据集。最后，我将展示我们的结果，并以一个小结论结束。

Dataset

使用的数据集为SEED数据集，该数据集是由吕宝良教授领导的BCMI实验室提供的EEG数据集。这个数据集和DEAP数据集是基于脑电图的影响计算中最重要的两个数据集。

它包含从15名参与者收集的62通道脑电图数据，这些参与者对相同的15个电影片段进行了三次会话。对于每一个电影片段，通过平均20个参与者的评分来分配一个情感评分(积极、中性或消极)，这些参与者被要求在看完电影后指出三个关键词中的一个。

总之：

参加人数:15人
Sessions x 视频：3 x 15(每个参与者45个视频)

Batch normalization

批归一化首先由Ioffe和Szegedy(2015)引入，以解决内部协变量移位的问题，这是学习过程中神经元激活分布中不必要的漂移。它是神经网络中实现最多的归一化方法，在多种应用中表现出了良好的性能。

正如下面进一步解释的那样，我们根据我们的目的略微调整了该方法。图2说明了批处理规范化方法的实现。对于这种方法，对每个批次的每个特征进行归一化。

在这里插入图片描述

图2。批归一化方法。数据按照每个特征进行规范化，独立于参与者和会话。