关于Neural Network（MLPs）的训练前准备：数据预处理和网络初始化

最新推荐文章于 2024-09-01 22:25:58 发布

Trasper1

最新推荐文章于 2024-09-01 22:25:58 发布

阅读量2k

点赞数 1

分类专栏：机器学习神经网络 batch 网络初始化数据预处理文章标签：数据预处理网络初始化机器学习神经网络 Batch Normalization

本文链接：https://blog.csdn.net/Trasper1/article/details/82256518

版权

本文详细介绍了训练Neural Network（MLPs）前的数据预处理，包括Mean Subtraction, Scaling/Normalization和PCA，以及网络初始化，强调了打破对称性和控制内部协变量偏移的重要性，提出Batch Normalization作为有效手段。" 81590891,7300664,CentOS7 使用 Apache2.4+mod_wsgi 部署Django项目教程,"['centos', '项目部署', 'django', 'httpd', 'mod_wsgi']

摘要由CSDN通过智能技术生成

训练一个的Neural Network（特指由FC层和non-linearity构成的MLP式网络），为了达到又快又好的convergence，训练前的准备非常重要。这里主要谈个主要的预训练措施：数据预处理 and 网络初始化。

一. 数据预处理：

本文还是以在CIFAR-10上做10分类任务为背景展开（训练集50000张32 * 32 * 3 = 3072dim的图片，X∈[N , D] = [50000, 3072]）。所谓数据预处理，就是把这个3072维空间上的50000个点的数据进行处理，使得他们在3072维feature空间的各个单个feature维度上，具有很好的分布（distribution）性质。注意，这里把3072维feature中的每一维看做一个variable，是50000个采样的distribution。

数据预处理的核心（即希望处理后的数据集）有三：1. zero-mean（zero-centered）；2. unit varaiance；3. low dimensionality; 4. Features de-correlation。