机器学习中的标准化和归一化

原创

已于 2024-07-11 19:17:23 修改 · 875 阅读

14 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #人工智能 #python

于 2024-07-11 19:13:26 首次发布

标准化和归一化是两种常用的数据预处理技术。它们用于将数据缩放到一个特定的范围，以提高机器学习模型的性能。

1. 标准化 (Standardization)

标准化将数据转换为均值为0，标准差为1的分布。公式如下：

$\boldsymbol{\mathbf{}z = \frac{x-\mu }{\sigma}}$

其中：

$z$ 是标准化后的值
$x$ 是原始值
$\mu$ 是原始数据的均值

$\sigma$ 是原始数据的标准差

from sklearn.preprocessing import StandardScaler

def test():
    # 准备数据
    data = [
        [5, 20, 10,

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

好好学习Py

关注关注

11
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

机器学习中的数据归一化、最值归一化、均值方差归一化（标准化）

iioSnail的博客

06-15

2万+

文章目录为什么要进行数据归一化什么是数据归一化最值归一化（Normalization）最值归一化的适用性均值方差归一化（Standardization）为什么要这么归一化呢？参考文献为什么要进行数据归一化 我们来考虑这样一个场景，我要使用KNN算法来预测一个人的职业。目前我们提取到了一批数据，如下：工作年限工资职业 1 8000 程序员 2 12000 程序员 3 15000 程序员 4 18000 程序员 1 3000 土木工程 2 3500 土木工程 3

机器学习中数据标准化相关方法

weixin_49446112的博客

12-03

5949

拿到一批原始数据后，经过对缺失值的填补、异常值的处理以及组合型数据的生成，可以得到一份较为完整的数据集。但是不同指标具有不同的性质（连续、离散）和不同的数量级，直接进行训练会削弱数量级较低数据带来的影响，所以还需要对数据进行标准化处理（目标值通常不需要缩放），才能让数据可以投入训练。数据标准化就是把有量纲的数据变成无量纲的数据，把量级不同的数据处理到同一个量级，从而让不同纬度的数据之间具有可比性，对于机器学习来说，用来提升模型的预测效果。具体常用的标准...

参与评论您还未登录，请先登录后发表或查看评论

机器学习中的标准化/归一化

不眠旅行

09-20

1万+

数据的标准化是将数据按比例缩放，使之落入一个小的特定区间。在一些数据比较和评价中常用到。典型的有归一化方法。归一化方法的主要有两种形式：一种是把数变为（0，1）之间的小数，一种是把有量纲表达式变为无量纲表达式。笔记的目的是弄清概念，和python的实现。

机器学习中的归一化与标准化（详解）

最新发布

经天纬地，格物致理

10-11

1081

归一化是将特征线性地缩放到一个固定范围（通常是[0, 1]或[-1, 1]），保持比例关系但改变绝对值。x′x−xmin⁡xmax⁡−xmin⁡x′xmax−xminx−xminxxx：原始数据xmin⁡xmax⁡xminxmax：该特征的最小值与最大值x′x'x′：归一化后的值（范围为 [0, 1]）✅优点简单直观；对数值范围固定的特征效果好；

机器学习(补充知识)之归一化与标准化的概念和区别

Zkangsen的博客

05-24

3454

个人学习笔记(欢迎交流指正): 归一化与标准化的概念和区别 1. 归一化与标准化的概念和区别 1. 归一化： 1) 把数据变成(0,1)或者(-1,1)之间的小数。主要是为了数据处理方便提出来的，把数据映射到0～1范围之内处理，更加便捷快速。 2) 把有量纲表达式变成无量纲表达式，便于不同单位或量级的指标能够进行比较和加权。...

机器学习中之规范化，中心化，标准化，归一化，正则化，正规化

answer3lin的博客

12-11

1万+

一、归一化，标准化和中心化广义的标准化：（1）离差标准化(最大最小值标准化）（2）标准差标准化 （3）归一化标准化 （4）二值化标准化 （5）独热编码标准化 归一化 （Normalization）、标准化 （Standardization）和中心化/零均值化（Zero-centered） 标准化 数据的标准化（normalization）是将数据按比例缩放（scale），使之落入...

【机器学习】一文搞懂标准化，归一化，正则化

一个程序员

12-09

9213

归一化（Normalization）: 将一列数据变化到某个固定区间（范围）中，通常，这个区间是[0,1],广义的讲，可以是各种区间，比如映射到[0,1] 也可以映射到其他范围，在图像中可能会映射到[0, 255], 其他情况也有可能映射到[-1,1];最大值最小值的归一化,范围[0,1]均值归一化（Mean normalization）, 范围[-1,1]标准化(Standardization): 将数据变换为均值为0，标准差为1的分布。标准化=Xi−μσ。

【机器学习】数据预处理 - 归一化和标准化_归一化处理

2401_84254087的博客

04-28

2901

在实际的渗透测试过程中，面对复杂多变的网络环境，当常用工具不能满足实际需求的时候，往往需要对现有工具进行扩展，或者编写符合我们要求的工具、自动化脚本，这个时候就需要具备一定的编程能力。存款的数值跟其他数据不在一个数量级，这意味着存款的对择偶结果的影响比较大，但我们认为这三个特征同样重要，这时候就需要把这些规格不同的数据转换到同一规格。恭喜你，如果学到这里，你基本可以从事一份网络安全相关的工作，比如渗透测试、Web 渗透、安全服务、安全分析等岗位；如果等保模块学的好，还可以从事等保工程师。

机器学习中数据归一化处理

07-23

保持一致性：在训练集和测试集上使用相同的归一化参数（如最值、均值和标准差），以确保模型在不同数据集上的表现一致。注意异常值：异常值可能对归一化结果产生较大影响，需提前进行处理或采用鲁棒性更强的归一化...

深入理解数据预处理：标准化与归一化的区别及实现

11-04

预处理过程中，数据的标准化和归一化是经常使用的技术。标准化和归一化虽然都是对数据分布进行调整，但两者的目的和方法有所不同。 标准化是指将数据的值减去其均值，并除以其标准差，使数据服从标准正态分布，即...

机器学习之标准化和归一化

diaoer7075的博客

06-04

253

归一化：１）把数据变成(０，１)或者（1,1）之间的小数。主要是为了数据处理方便提出来的，把数据映射到0～1范围之内处理，更加便捷快速。２）把有量纲表达式变成无量纲表达式，便于不同单位或量级的指标能够进行比较和加权。归一化是一种简化计算的方式，即将有量纲的表达式，经过变换，化为无量纲的表达式，成为纯量。标准化：在机器学习中，我们可能要处理不同种类的资料，例如，音讯和图片上的像...

【机器学习（6）】数据预处理：预处理、标准化和数据纠偏

12-22

模型评价体系回顾一下以前提及的模型评价的体系类别概念模型（model）规律和经验学习（learning）从数据中总结规律的过程误差（error）衡量模型准确性的指标训练集（教材教辅）训练模型的数据集验证集（模拟考卷）测试学习模型泛化能力的数据集应用数据（高考）模型实际应用场景的特征集数据预处理与特征工程概念：数据预处理与特征工程泛指对训练数据集进行特征增加、删除、变换的方法目标：通过对训练数据的处理变换，提高模型训练表现和泛化能力类别：特征变换：预处理、标准化、纠偏特征增加与删减：

机器学习数据预处理之数据标准化（附Python代码实现）

热门推荐

qq_43129538的博客

11-28

1万+

这是一个新的专题！欢迎来到全新的篇章，这里我们将会学到机器学习的一些小知识。在这里我们可以学到：1、Python第三方库numpy、pandas以及sklearn库的使用2、机器学习的基本概念和流程3、机器学习的一些基本算法待续…

【机器学习】了解机器学习中标准化的概念

fengdu78的博客

12-05

1067

作者 | Myron Dsilva 编译 | Flin 来源 | analyticsvidhya介绍标准化是一种特征缩放技术，它以这样的方式缩小数据，即依赖于距离和权重的算法（如KNN、Logistic Regression等）不应受到不均匀缩放数据集的影响，因为如果发生这种情况，则模型精度将不会很好（将在实际中显示出来）。如果我们将以数据点以均值为中心且分布的标准偏差为1...

机器学习中的归一化和标准化

python技术专家

06-19

489

机器学习：归一化、标准化

机器学习（归一化、去中心化、标准化）

千天夜的博客

03-07

2900

机器学习（归一化、去中心化、标准化）

机器学习笔记--1.5 数据标准化处理

slcod的博客

01-17

672

1.数据标准化 标准化后的值 = （标准化前的值 - 分量的均值）/ 分量的标准差 vectormat = mat([[1, 2, 3], [4, 5, 6]]) v12 = vectormat[0] - vectormat[1] print(sqrt(v12 * v12.T)) #标准化 varmat = std(vectormat.T, axis = 0) normvmat = (vectormat - mean(vectormat)) / varmat.T normv12 = normvmat[

机器学习中关于数据的归一化和标准化

听了个听儿

06-16

1398

机器学习 数据预处理

【机器学习】数据标准化

weixin_42264056的博客

05-30

2928

数据标准化与归一化总结

数据标准化与归一化：机器学习预处理关键

数据标准化与归一化是机器学习中不可或缺的数据预处理步骤，它对于确保数据的一致性和有效性至关重要。在处理数据时，我们需要将数据转换到一个共同的尺度，以便于模型训练和比较，消除量纲差异带来的影响。数据标准...