标准化、归一化等的适用范围

最新推荐文章于 2024-08-23 10:00:00 发布

天天向上的宇同学

最新推荐文章于 2024-08-23 10:00:00 发布

阅读量2.9k

点赞数 2

分类专栏：机器学习文章标签： python

本文链接：https://blog.csdn.net/ai_he_tang/article/details/116893478

版权

本文介绍了特征处理中的标准化和归一化，包括它们的计算方法、适用范围以及不同情况下的选择。标准化适合数据存在异常值和噪音的情况，而归一化适用于对输出范围有要求的场景。在某些模型如SVM、KNN和神经网络中，标准化通常是首选。文章还提到，在数据集规模变化时，标准化的稳定性优于归一化。

摘要由CSDN通过智能技术生成

特征处理方法总览：

在这里插入图片描述

标准化和归一化介绍：

（1）标准化
　　标准化需要计算特征的均值和标准差，公式表达为：
在这里插入图片描述
　　使用preproccessing库的StandardScaler类对数据进行标准化的代码如下

from sklearn.preprocessing import StandardScaler
from sklearn.datasets import load_iris
iris=load_iris()
#标准化，返回值为标准化后的数据
StandardScaler().fit_transform(iris.data)

(2)归一化
在这里插入图片描述
使用preproccessing库的Normalizer类对数据进行归一化的代码如下：

from sklearn.preprocessing import Normalizer
#归一化，返回值为归一化后的数据
Normalizer().fit_transform(iris.data)

区间缩放法其实是归一化的一种：

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

天天向上的宇同学

关注关注

2
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

数据预处理：标准化和归一化

Java/Python大数据成长之路

12-31

1006

1、数据预处理概述2、数据标准化3、数据归一化4、标准化和归一化怎么选在选择了合适模型的前提下，机器学习可谓是“训练台上3分钟，数据数量和质量台下10年功”。数据的收集与准备是机器学习中的重要一步，是构建一个好的预测模型大厦的基石。数据的数量与质量直接决定了预测模型的好坏所以，在数据的收集与准备这一步中，必须做好数据预处理。Scikit-Learn提供了标准化和归一化等API方便我们进行数据预处理。标准化和归一化是常用的数据缩放方式。

标准化归一化适用范围

好好学习,天天向上的博客

03-28

1381

1、需要归一化的模型：神经网络：标准差归一化 支持向量机：标准差归一化 线性回归，可用梯度下降求解，标准差归一化 逻辑回归聚类算法 K近邻 PCA LDA 2、不需要归一化的模型：决策树：每次筛选都只考虑一个变量，不考虑变量之间的相关性，故不需要归一化 随机森林：不需要归一化，mtry为变量个数的均方根朴素贝叶斯 3、需要正则化的模型： Lasso Elastic Net 参考文章： ht...

参与评论您还未登录，请先登录后发表或查看评论

標準化，歸一化和的概念与适用范围整理

微电子学与固体电子学-俞驰

10-31

321

網上講得比較亂有些博客把歸一化和標準化認爲一致，主要是覺得normalization這個詞語翻譯成標準化和歸一化都沒啥問題 Min-Max scaling（歸一化），也可以使用normalization，但是谷歌上不推薦，公式是：網上通俗的說法是：用來消除量鋼的影響。這個說法是不準確的，因爲有的特徵顯然需要比重大一些，有的需要比重小一些。這個“消除量鋼影響”的說法其實是默認數據特徵是一...

十大数据预处理方法最强总结（一）标准化、归一化

最新发布

star_nwe的博客

08-23

2441

AI大模型作为人工智能领域的重要技术突破，正成为推动各行各业创新和转型的关键力量。抓住AI大模型的风口，掌握AI大模型的知识和技能将变得越来越重要。学习AI大模型是一个系统的过程，需要从基础开始，逐步深入到更高级的技术。这里给大家精心整理了一份全面的AI大模型学习资源，包括：AI大模型全套学习路线图（从入门到实战）、精品AI大模型学习书籍手册、视频教程、实战学习、面试题等，资料免费分享！

归一化和标准化

互联网知识分享

12-23

1584

如果特征的分布对模型影响较小，可以选择归一化。归一化和标准化是数据预处理中常用的技术，用于将不同特征的数据缩放到相同的范围或分布中，以便模型能够更好地学习和预测。归一化和标准化是常用的数据预处理技术，可以帮助我们更好地处理特征数据，提高模型的性能。以上示例代码中，我们首先创建了示例数据，然后分别使用MinMaxScaler和StandardScaler对数据进行归一化和标准化，并打印出处理后的数据。通过归一化和标准化，我们可以更好地使不同特征的数据具有相同的尺度和分布，从而提高模型的性能和准确性。

归一化种类

qq_40078576的博客

06-17

1176

1. 归一化有哪些类型 Min-max normalization (Rescaling)： x′=x−min(x)max(x)−min(x) 归一化后的数据范围为 [0, 1]，其中 min(x)、max(x) 分别求样本数据的最小值和最大值。 Mean normalization： x′=x−mean(x)max(x)−min(x) 归一化后的数据范围为 [-1, 1]，其中 mean(x) 为样本数据的平均值。 Z-score normalization (Standardization)： x′=x

将数据归一化到任意区间范围的方法

qq_43270687的博客

07-10

2146

将数据归一化到[a,b]区间范围的方法：（1）首先找到样本数据Y的最小值Min及最大值Max （2）计算系数为：k=（b-a)/(Max-Min) （3）得到归一化到[a,b]区间的数据：norY=a+k(Y-Min) ...

使用sklearn进行对数据标准化、归一化以及将数据还原的方法

09-20

在机器学习和数据分析中，数据预处理是至关重要的步骤，其中数据标准化和归一化是两种常见的预处理技术。本文将详细介绍如何使用Python中的scikit-learn（sklearn）库来执行这两种操作，并讨论如何将数据还原到其...

详解python实现数据归一化处理的方式：（0,1）标准化

09-19

（0,1）标准化的基本思想是将数据的取值范围缩放到0到1之间，公式如下： \[ \text{Normalized Value} = \frac{\text{Value} - \text{Min}}{\text{Max} - \text{Min}} \] 这个过程可以确保数据经过处理后，所有特征...

归一化 （Normalization）、标准化 （Standardization）和中心/零均值化（Zero-centered）

热门推荐

ytusdc的博客

12-31

7万+

b、梯度：以输入-隐层-输出这样的三层BP为例，我们知道对于输入-隐层权值的梯度有2ew(1-a^2)*x的形式（e是误差，w是隐层到输出层的权重，a是隐层神经元的值，x是输入），若果输出层的数量级很大，会引起e的数量级很大，同理，w为了将隐层（数量级为1）映身到输出层，w也会很大，再加上x也很大的话，从梯度公式可以看出，三者相乘，梯度就非常大了。归一化是一种简化计算的方式，即将有量纲的表达式，经过变换，化为无量纲的表达式，成为纯量。中心化，也叫零均值处理，就是将每个原始数据减去这些数据的均值。

归一化问题

lwwangfang的博客

09-05

1万+

使用matlab学习svm，发现在对数据进行预处理时，要对数据进行归一化，并且，遇到问题：训练数据和测试数据是一起归一化处理好还是分开归一化处理好？怎么确定归一化的范围多大？是[0,1]还是[-1,4]等，为什么归一化范围不同，对分类精度有影响？断断续续的在网上找了几天，和同学讨论了一下，总想找个确凿的答案，但是总结来说为： 1、大多数情况应该对数据进行归一化处理，特别是在特征范围相差较大情况

python实现将数据标准化到指定区间[a,b]+正向标准化+负向标准化

2301_81199775的博客

04-18

765

python实现将数据标准化到指定区间[a,b]+正向标准化+负向标准化

标准化、归一化、正则化

qq_44219277的博客

03-08

1260

1.归一化 x’ = (x - X_min) / (X_max - X_min) 归一化后的数据取值区间为[0,1] from sklearn.preprocessing import MinMaxScaler import numpy as np data = np.random.uniform(0, 100, 10)[:, np.newaxis] #随机生成10个在区间[0,100)上服从均匀分布的数据 mm = MinMaxScaler() mm_data = mm.fit_transform(dat

[机器学习笔记] 数据标准化方法

梅森上校的博客业精于勤荒于嬉，形成于思毁于随。

04-04

1133

数据标准化方法数据标准化 在数据分析之前，我们通常需要先将数据标准化（Normalization），利用标准化后的数据进行数据分析。数据标准化也就是统计数据的指数化。数据标准化处理主要包括数据同趋化处理和无量纲化处理两个方面。目前数据标准化方法有多种，归结起来可以分为直线型方法(如极值法、标准差法)、折线型方法(如三折线法)、曲线型方法(如半正态性分布)。不同的标准化方法，对系统的评价结...

数据标准化处理

babychrislee3的博客

12-28

4512

Z-score 标准化 适用范围 1.数据的最大值和最小值未知 2.有超出取值范围的离群数据经过处理的数据符合标准正态分布，即均值为0，标准差为1，其转化函数为： x∗=（x−μ）/σ 标准化后的变量值围绕0上下波动，大于0说明高于平均水平，小于0说明低于平均水平。缺点估算Z-Score需要总体的平均值与方差，但是很难得到，大多数情况下是用样本的均值与标准差替代。对于数据的分布有一定的...

关于机器学习何时使用归一化和标准化

weixin_62077732的博客

01-13

2169

机器学习入门-数据何时归一化和标准化

深度学习基础笔记——归一化

MengYa_Dream的博客

08-16

1万+

Batch Normalization BN 1 归一化概念 2 归一化作用 归一化为什么能提高求解最优解速度3D 图解未归一化 局部响应归一化作用及理解 3 归一化类型线性归一化 标准差标准化非线性归一化 4 批归一化（Batch Normalization，BN）概念 5 批归一化算法流程及优点 6 批归一化和群组归一化 7Weight Normalization和Batch Normalization比较【Batch Normalization使用场景】

标准化、归一化

csdn_lzw的博客

05-01

2877

一、标准化与归一化 数据的标准化（normalization）是将数据按比例缩放，使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到，去除数据的单位限制，将其转化为无量纲的纯数值，便于不同单位或量级的指标能够进行比较和加权。其中最典型的就是数据的归一化处理，即将数据统一映射到[0,1]区间上。二、标准化方法及适用场景最常见的有这两种： 1. Min-max 标准化...

标准化和归一化的异同点适用范围

03-21

标准化和归一化是常用的数据预处理方法，用于将不同尺度或分布的数据转换为统一的... - 归一化适用于需要将数据映射到固定范围的情况，例如在使用梯度下降等优化算法时，需要将特征值缩放到0到1之间，以加快收敛速度。