标准化算法_归一化(MinMax)和标准化(Standard)的区别

最新推荐文章于 2025-03-13 07:13:30 发布

香江不知名前浪

最新推荐文章于 2025-03-13 07:13:30 发布

阅读量1.8k

点赞数

文章标签：标准化算法

本文链接：https://blog.csdn.net/weixin_34119722/article/details/112716798

版权

标准化和归一化是数据预处理的重要方法。归一化将数据范围缩放至0-1之间，而标准化使数据服从均值0、方差1的标准正态分布。在KNN等距离度量的算法中，标准化更常用于保持样本间距和满足统计学假设。当存在异常值时，标准化能更好地处理数据分布，避免样本被“挤”到一起，有助于模型更快收敛。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

此文参考https://blog.csdn.net/u010947534/article/details/86632819

定义上的区别

归一化：将数据的值压缩到0到1之间，公式如下

标准化：将数据所防伪均值是0，方差为1的状态，公式如下：

归一化、标准化的好处：

在机器学习算法的目标函数(例如SVM的RBF内核或线性模型的l1和l2正则化)，许多学习算法中目标函数的基础都是假设所有的特征都是零均值并且具有同一阶数上的方差。如果某个特征的方差比其他特征大几个数量级，那么它就会在学习算法中占据主导位置，导致学习器并不能像我们说期望的那样，从其他特征中学习。

举一个简单的例子，在KNN中，我们需要计算待分类点与所有实例点的距离。假设每个实例点（instance）由n个features构成。如果我们选用的距离度量为欧式距离，如果数据预先没有经过归一化，那么那些绝对值大的features在欧式距离计算的时候起了决定性作用。

从

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

香江不知名前浪

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

Sklearn标准化和归一化方法汇总(2)：Min-Max归一化

Laurence的技术博客

01-17

5598

Min-Max归一化的算法是：先找出数据集通常是一列数据）的最大值和最小值，然后所有元素先减去最小值，再除以最大值和最小值的差，结果就是归一化后的数据了。经Min-Max归一化后，数据集整体将会平移到[0,1]的区间内，数据分布不变。

Sklearn标准化和归一化方法汇总(1)：标准化 / 标准差归一化 / Z-Score归一化

Laurence的技术博客

01-17

5342

标准化 / 标准差归一化 / Z-Score归一化的算法是：先求出数据集（通常是一列数据）的均值和标准差，然后所有元素先减去均值，再除以标准差，结果就是归一化后的数据了。经标准差归一化后，数据集整体将会平移到以0点中心的位置上，同时会被缩放到标准差为1的区间内。要注意的是数据集的标准差变为1，并不意味着所有的数据都会被缩放到[-1,1]之间，下文有示例为证。

参与评论您还未登录，请先登录后发表或查看评论

标准化和归一化比较

qq_34147366的博客

05-24

2114

机器学习中的标准化和归一化

归一化(MinMax)和标准化(Standard)哪个更好？

u013385018的专栏

09-22

6479

定义上的区别 归一化：将数据的值压缩到0到1之间，公式如下 标准化：将数据所防伪均值是0，方差为1的状态，公式如下： 归一化、标准化的好处：在机器学习算法的目标函数(例如SVM的RBF内核或线性模型的l1和l2正则化)，许多学习算法中目标函数的基础都是假设所有的特征都是零均值并且具有同一阶数上的方差。如果某个特征的方差比其他特征大几个数量级，那么它就会在学习算法中占据主导位置，导致学习器并不能像我们说期望的那样，从其他特征中学习。举一个简单的例子，在KNN中，我们需要计算待分类点.

归一化公式

热门推荐

u012101561的博客

05-18

2万+

在机器学习和数据挖掘中，经常会听到两个名词：归一化（Normalization）与标准化（Standardization）。它们具体是什么？带来什么益处？具体怎么用？本文来具体讨论这些问题。一、是什么 1. 归一化 常用的方法是通过对原始数据进行线性变换把数据映射到[0,1]之间，变换函数为：其中max为样本数据的最大值，min为样本数据的最小值。这

python 标准化 使数组和为1_基于数据归一化以及Python实现方式

weixin_39526741的博客

03-01

2536

数据归一化：数据的标准化是将数据按比例缩放，使之落入一个小的特定区间，去除数据的单位限制，将其转化为无量纲的纯数值，便于不同单位或量级的指标能够进行比较和加权。为什么要做归一化：1)加快梯度下降求最优解的速度如果两个特征的区间相差非常大，其所形成的等高线非常尖，很有可能走“之字型”路线(垂直等高线走)，从而导致需要迭代很多次才能收敛。2)有可能提高精度一些分类器需要计算样本之间的距离，如果一个特征...

机器学习 归一化 标准化_机器学习中的标准化

weixin_26717681的博客

09-26

1773

机器学习 归一化 标准化Normalization is a technique often applied as part of data preparation for machine learning. The goal of normalization is to change the values of numeric columns in the dataset to use a co...

DataScience：数据预处理/特征工程之线性变换—四种特征缩放Scaling算法简介、区间缩放归一化和非固定区间归一化(即标准化)的各自角度的概述与对比、国外文章的解读

头部AI社区如有邀博主AI主题演讲请私信—心比天高，仗剑走天涯，保持热爱，奔赴向梦想！低调，专注，谦虚，自律，反思，成长，还算比较正能量的博主，公益免费传播…内心特别想在AI界做出一些可以推进历史进程影响力的技术(兴趣使然，有点小情怀，也有点使命感呀

04-22

1010

DataScience：数据预处理/特征工程之线性变换—四种特征缩放Scaling算法简介、区间缩放归一化和非固定区间归一化(即标准化)的各自角度的概述与对比、国外文章的解读目录数据处理中常见的四种(Feature scaling)特征缩放算法对比 1、Rescaling (min-max normalization) 有时简称normalization(有点坑) 2、Mean normalization 3、Standardization(Z-score

不要再搞混标准化与归一化啦，数据标准化与数据归一化的区别！！

qlkaicx的博客

01-13

1906

不同目的不同。数据标准化主要目的是消除量纲影响,数据归一化主要目的是加快模型收敛速度。方法不同。数据标准化常用最小-最大标准化或z-score标准化,数据归一化常用线性转换到固定区间。影响不同。数据标准化主要影响数据的比较,数据归一化主要影响模型训练效果。相同都是数据预处理技术,目的是对原始数据进行转换。都将数据映射到固定范围内,数据标准化映射到平均值为0、标准差为1,数据归一化映射到0-1或-1-1区间。都可以消除大数小数问题,加强数据的可比性。

十大数据预处理方法最强总结（一）标准化、归一化

star_nwe的博客

08-23

3906

AI大模型作为人工智能领域的重要技术突破，正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口，掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程，需要从基础开始，逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源，包括：AI大模型全套学习路线图（从入门到实战）、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等，资料免费分享！

机器学习中数据特征的处理 归一化vs标准化，哪个更好

deephub

05-06

6483

众所周知，特征工程是将原始数据转换为数据集的过程。有各种可用的功能工程技术。两种最广泛使用且最容易混淆的特征工程技术是： 标准化 归一化 今天我们将探讨这两种技术，并了解数据分析师在解决数据科学问题时所做出的一些常见假设。另外，本教程的全部代码都可以在下面的GitHub存储库中找到: https://github.com/Tanu-N-Prabhu/Python/blob/m...

均值归一化

12-06

423

转载于:https://www.cnblogs.com/bingws/p/10079571.html

数据标准化 和数据归一化该如何选择？

口袋里的小小哥的博客

03-31

2253

MinMaxScaler, StandardScaler数据预处理中常用的两种缩放方法，用于将数据标准化或归一化到特定的范围或分布

weixin_41046245的博客

02-06

2214

和是数据预处理中常用的两种缩放方法，用于将数据标准化或归一化到特定的范围或分布。这两种缩放方法的主要区别在于它们的目标和实现方式。

均值归一化_数据归一化（Feature Scaling）

weixin_39714835的博客

10-19

934

一、为什么要进行归一化? 举个例子，我们统计了一张表，上面统计了行人的属性：身高（cm）、年龄（岁）【暂且就两个属性】，现在我们要计算各个行人之间的欧式距离。如果大家年龄都差不多，这时候欧氏距离的大小就被身高这一属性所支配了，比如两个人都是 20 岁，一个人 160cm，另一个人 190 cm。很显然，我们需要将这些量纲不同的属性数据映射到同一个尺度空间中，这就是归一化。二、归一化的方...

均值归一化_数据归一化

weixin_39603823的博客

11-21

2375

数据归一化[TOC] 将所有的数据映射到同一尺度。首先，为什么需要数据归一化？举个简答的例子。样本间的距离时间所主导，这样在样本1以[1, 200]输入到模型中去的时候，由于200可能会直接忽略到1的存在，因此我们需要将数据进行归一化。比如将天数转换为占比1年的比例，200/365=0.5479, 100/365=0.2740。一、最值归一化 最值归一化（Nor...