数据预处理：归一化/标准化/中心化

最新推荐文章于 2024-07-16 10:23:12 发布

山上有只羊M

最新推荐文章于 2024-07-16 10:23:12 发布

阅读量554

点赞数

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shanshangyouzhiyangM/article/details/85165599

版权

深度学习专栏收录该内容

18 篇文章 3 订阅

订阅专栏

为什么归一化/标准化？

归一化/标准化实质是一种线性变换，线性变换有很多良好的性质，这些性质决定了对数据改变后不会造成“失效”，反而能提高数据的表现，这些性质是归一化/标准化的前提。比如有一个很重要的性质：线性变换不会改变原始数据的数值排序。

使用的场景

梯度下降法求解最优化问题时：
可以加快求解速度，也就是提升收敛速度

归一化/标准化的方法

归一化到0 ~ 1 或 -1 ~ 1之间

方法：
0~1之间
在这里插入图片描述

目的：
1）主要是为了数据处理方便提出来的，把数据映射到0～1范围之内处理，更加便捷快速。
2）把有量纲表达式变成无量纲表达式，便于不同单位或量级的指标能够进行比较和加权。

标准化（减均值再除以标准差）

在机器学习中，我们可能要处理不同种类的资料，例如，音讯和图片上的像素值，这些资料可能是高维度的。

资料标准化后会使每个特征中的数值平均变为0(将每个特征的值都减掉原始资料中该特征的平均)、标准差变为1，这个方法被广泛的使用在许多机器学习算法中(例如：支持向量机、逻辑回归和类神经网络)。

中心化/零均值化（减均值）

平均值为0，对标准差无要求

山上有只羊M

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。