归一化

最新推荐文章于 2024-05-30 10:55:05 发布

aihaly

最新推荐文章于 2024-05-30 10:55:05 发布

阅读量2.8k

点赞数

分类专栏： Matlab Machine learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aihali/article/details/41896783

版权

Machine learning 同时被 2 个专栏收录

98 篇文章 0 订阅

订阅专栏

9 篇文章 0 订阅

订阅专栏

1、数据预处理在众多深度学习算法中都起着重要作用，实际情况中，将数据做归一化和白化处理后，很多算法能够发挥最佳效果。然而除非对这些算法有丰富的使用经验，否则预处理的精确参数并非显而易见。

提示：当我们开始处理数据时，首先要做的事是观察数据并获知其特性。本部分将介绍一些通用的技术，在实际中应该针对具体数据选择合适的预处理技术。例如一种标准的预处理方法是对每一个数据点都减去它的均值（也被称为移除直流分量，局部均值消减，消减归一化），这一方法对诸如自然图像这类数据是有效的，但对非平稳的数据则不然。

2、数据归一化

数据预处理中，标准的第一步就是数据归一化。虽然这里有一些列可行的方法，但是这一步通常根据数据的具体情况而明确选择的。特征归一化常用的方法主要包含以下几种：

简单缩放
逐样本均值消减（也称为移除直流分量）
特征标准化（使数据集中所有特征都具有零均值和单位方差）

简单缩放：在简单缩放中，目的是通过对数据的每一个维度的值进行重新调整（这些维度可能是相互独立的），使得最终的数据向量落在[0,1]或平[-1,1]的区间内（根据数据情况而定）。这对后续的处理十分重要，因为很多默认参数（如PCA-白化中的epsilon）都假定数据已被缩放到合理的区间。

例子：在处理自然图像时，获得的像素值在[0,255]区间中，常用的处理是将这些像素值除以255，使它们缩放到[0,1]中。

逐样本均值消减：如果数据是平稳的（即数据每一个维度的统计都服从相同分布），那么你可以考虑在每个样本上减去数据的统计平均值（逐样本计算）。

例子：对于图像，这种归一化可以移除图像的平均亮度值（intensity）。很多情况下，对图像的照度并不是很感兴趣，而更多的关注内容，这时对每个点移除像素的均值是有意义的，注意：虽然该方法广发地应用于图像，但是在处理彩色图像时，需要格外小心，具体的说，是因为不同色彩通道中的像素并不存在平稳特性。

特征标准化：特征标准化指的是（独立地）使得数据的每一个维度具有零均值和单位方差。这是归一化中最常见的方法并被广泛地使用（例如，在使用支持向量机（SVM）时，特征标准化常被建议用作预处理的一部分）。在实际应用中，特征标准化的具体做法是：首先计算每一个维度上数据的均值（使用全体数据计算），之后在每一个维度上都减去该均值。下一步便是在数据的每一维度上除以该维度上数据的标准差。例子：处理音频数据时，常用 Mel 倒频系数 MFCCs 来表征数据。然而MFCC特征的第一个分量（表示直流分量）数值太大，常常会掩盖其他分量。这种情况下，为了平衡各个分量的影响，通常对特征的每个分量独立地使用标准化处理。

其中matlab中有一个归一化的函数： mapminmax ，它的作用是Map matrix row minimum and maximum values to [-1 1].

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
归一化

1、数据预处理在众多深度学习算法中都起着重要作用，实际情况中，将数据做归一化和白化处理后，很多算法能够发挥最佳效果。然而除非对这些算法有丰富的使用经验，否则预处理的精确参数并非显而易见。提示：当我们开始处理数据时，首先要做的事是观察数据并获知其特性。本部分将介绍一些通用的技术，在实际中应该针对具体数据选择合适的预处理技术。例如一种标准的预处理方法是对每一个数据点都减去它的均值（也被称为移
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。