均值归一化_归一化与标准化的Python实现

最新推荐文章于 2021-09-26 10:06:00 发布

weixin_39581739

最新推荐文章于 2021-09-26 10:06:00 发布

阅读量530

点赞数

文章标签：均值归一化

概念

归一化：缩放仅仅跟最大、最小值的差别有关；输出范围在a-b之间

标准化：缩放和每个点都有关系，通过均值μ和标准差σ体现出来；输出范围是负无穷到正无穷

相同点：归一化和标准化的本质都是一种线性变换，线性变换不改变原始数据的数值排序

优点

提升模型的收敛速度
提升模型的精度
深度学习中数据归一化可以防止模型梯度爆炸

使用场景

如果对输出结果范围有要求，用归一化
如果数据较为稳定，不存在极端的最大最小值，用归一化
如果数据存在异常值和较多噪音，用标准化，可以间接通过中心化避免异常值和极端值的影响

python实现

sklearn轮子：

归一化：import sklearn.preprocessing.MinMaxScaler

标准化：import sklearn.preprocessing.StandardScaler

拓展

问：如何归一化到任意[a,b]区间内呢？

答：首先我们来看下如何归一化到[0,1]的。

区间长度为1-0=1，我们把它平分到(max-min)中，那么每一份为1/(max-min)
很显然，对应的x占(x-min)份，那么归一化后的x_norm = 1/(max-min) * (x-min)

同理，区间[a,b]可以写成a+[0,b-a]，那么

区间长度为b-a-0=(b-a)，我们把它平分到(max-min)中，那么每一份为(b-a)/(max-min)
同理，对应的x占(x-min)分，那么归一化后的x_norm = a + [(b-a)/(max-min) * (x-min)]

注意

用于测试数据标准化的均值和标准差都是在训练数据上计算得到的，在工作流程中，你不能使用在测试数据集上计算得到的任何结果，即使是像数据标准化这么简单的事情。归一化同理

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39581739

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python 数据归一化_python 实现对数据集的归一化的方法(0-1之间)

weixin_39939918的博客

12-20

5024

python 实现对数据集的归一化的方法(0-1之间)多数情况下，需要对数据集进行归一化处理，再对数据进行分析#首先，引入两个库，numpy,sklearnfrom sklearn.preprocessing import MinMaxScalerimport numpy as np#将csv文件导入矩阵当中my_matrix = np.loadtxt(open("xxxx.csv"),deli...

python代码实现中心化_数据预处理之中心化（零均值化）与标准化（归一化）

weixin_39875167的博客

12-02

4227

在机器学习回归问题，以及训练神经网络过程中，通常需要对原始数据进行中心化(零均值化)与标准化(归一化)处理。背景在数据挖掘数据处理过程中，不同评价指标往往具有不同的量纲和量纲单位，这样的情况会影响到数据分析的结果，为了消除指标之间的量纲影响，需要进行数据标准化处理，以解决数据指标之间的可比性。原始数据经过数据标准化处理后，各指标处于同一数量级，适合进行综合对比评价。目的通过中心化和标准化处理，最终...

参与评论您还未登录，请先登录后发表或查看评论

使用sklearn进行对数据标准化、归一化以及将数据还原的方法

12-25

在对模型训练时，为了让模型尽快收敛，一件常做的事情就是对数据进行预处理。这里通过使用sklearn.preprocess模块进行处理。一、标准化和归一化的区别 归一化其实就是标准化的一种方式，只不过归一化是将数据映射到了[0,1]这个区间中。 标准化则是将数据按照比例缩放，使之放到一个特定区间中。标准化后的数据的均值＝0，标准差＝1，因而标准化的数据可正可负。二、使用sklearn进行标准化和标准化还原原理：即先求出全部数据的均值和方差，再进行计算。最后的结果均值为0，方差是1，从公式就可以看出。但是当原始数据并不符合高斯分布的话，标准化后的数据效果并不好。导入模块 fro

特征工程系列：特征预处理（上）

weixin_30736301的博客

08-13

265

特征工程系列：特征预处理（上）关于作者：JunLiang，一个热爱挖掘的数据从业者，勤学好问、动手达人，期待与大家一起交流探讨机器学习相关内容~ 0x00 前言数据和特征决定了机器学习的上限，而模型和算法只是逼近这个上限而已。由此可见，特征工程在机器学习中占有相当重要的地位。在实际应用当中，可以说特征工程是机器学习成功的关键。那特征工程是什么？特征工程是利用数据领域...

sklearn中实现标准化、归一化

weixin_30617797的博客

07-01

488

这里记录下标准化，归一化等内容： from sklearn.feature_extraction import DictVectorizer from sklearn.feature_extraction.text import CountVectorizer, TfidfVectorizer from sklearn.preprocessing import MinMaxSc...

TensorFlow笔记（5）--全面了解机器学习包SciKit-learn

Techblog of HaoWANG

07-04

484

官网传送门：https://scikit-learn.org/stable/index.html 一、简介今天为大家介绍的是scikit-learn。sklearn是一个Python第三方提供的非常强力的机器学习库，它包含了从数据预处理到训练模型的各个方面。在实战使用scikit-learn中可以极大的节省我们编写代码的时间以及减少我们的代码量，使我们有更多的精力去分析数据分布，...

python sklearn 归一化_Python开源机器学习框架：Scikit-learn

weixin_39926678的博客

11-26

188

Scikit-learnSciPy - 是一款方便、易于使用、专为科学和工程设计的Python工具包。基于SciPy，目前开发者们针对不同的应用领域已经发展出了为数众多的分支版本，它们被统一称为Scikits，即SciPy工具包的意思。而在这些分支版本中，最有名，也是专门面向机器学习的一个就是Scikit-learn(简写成sklearn)。Scikit-learn项目最早由数据科学家 David...

批量归一化代码_归一化_gis_python_批量_源码.zip

10-19

批量归一化通常应用于神经网络的隐藏层，它将每个批次（batch）的数据按特征进行标准化，使它们的均值为0，标准差为1，这样可以减少内部协变量漂移，提高模型的训练速度和泛化能力。 Python实现批量归一化的步骤： ...

基于数据归一化以及Python实现方式

09-20

实现标准差归一化的步骤与线性归一化类似，区别在于对数据进行变换时使用的是均值（mean）和标准差（standard deviation）。每列数据先减去该列的均值，然后除以标准差，得到符合标准正态分布的数据。对于非线性...

均值归一化_（十八）再识高斯（最大最小值、均值、方差、归一化）

weixin_39948277的博客

11-21

1166

时间为友，记录点滴。我们在之前有聊过高斯噪声，并且详细得说了高斯曲线的由来、性质以及代码实现。本次我们借助高斯分布的特点来认识一些OpenCV的API。他们分别是求像素的最大最小值以及其对应像素位置的minMaxLoc，和求一张图片中均值和方差的meanStdDev，以及做归一化的normalize。minMaxLoc官方代码中对这个API的介绍已经非常清楚，而且也没有什么难以理解的，搬运到这里...

python实现数据恢复_使用sklearn进行对数据标准化、归一化以及将数据还原的方法...

weixin_39653761的博客

11-28

999

python sklearn 归一化_您需要了解的有关Scikit-Learn最新更新的所有信息（使用Python实现）

weixin_39654058的博客

11-27

139

介绍Scikit-learn是一个Python库，我们在构建机器学习模型时都会不可避免地转向它。我已经使用这个很棒的库建立了无数模型，而且我敢肯定你们所有人也都必须拥有。毫无疑问– scikit-learn提供了易于使用的语法易读的工具。在流行的Python库的万神殿中，scikit-learn与Pandas和NumPy一起排在最高级。这三个Python库为机器学习管道的各个步骤提供了完整的解决方...

python sklearn 归一化_第3章 Sklearn概述

weixin_39664696的博客

11-26

197

Sklearn，该工具包是目前用于机器学习的五大主流Python包之一，适用于预处理、建模、验证及调优等机器学习开发的主要流程，覆盖除部分深度学习算法之外几乎所有常用的机器学习算法。Sklearn的环境搭建与安装；Sklearn的常用类及具体的使用场景。3.1 Sklearn的环境搭建与安装Sklearn又称为scikit-learn；该库提供了机器学习涉及的4个流程中的函数接口--数据预处理、建...

sklearn是python自带工具吗_python机器学习之Sklearn

weixin_39894233的博客

11-28

364

scikit-learn简称Sklearn，是一个开源的基于python的机器学习工具包。建立在NumPy, SciPy和Matplotlib等python数据库之上，几乎涵盖了所有的机器学习算法。sklearn安装1、安装要求Python(>=2.7 or >=3.3)、NumPy (>= 1.8.2)、SciPy (>= 0.13.3)2、如果已经安装NumPy和SciPy，安装scikit-...

sklearn实现归一化

热门推荐

qq_47180202的博客

09-26

1万+

归一化1、概览1.1、数据无量纲化1.2 归一化2、sklearn实现归一化2.1.引入库2.2.读入数据2.3、实例归一化方法1方法二（一步解决）2.4 逆转归一化结果2.5 将数据归一化到[0,1]以外的范围中 1、概览 1.1、数据无量纲化在机器学习算法实践中，我们往往有着将不同规格的数据转换到同一规格，或不同分布的数据转换到某个特定分布的需求，这种需求统称为将数据“无量纲化”。譬如梯度和矩阵为核心的算法中，譬如逻辑回归，支持向量机，神经网络，无量纲化可以加快求解速度；而在距离类模型，譬如K近邻

python标准化_【原】关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化...

weixin_39820158的博客

11-29

467

一、标准化（Z-Score），或者去除均值和方差缩放公式为：(X-mean)/std 计算时对每个属性/每列分别进行。将数据按期属性（按列进行）减去其均值，并处以其方差。得到的结果是，对于每个属性/每列来说所有数据都聚集在0附近，方差为1。实现时，有两种不同的方式：使用sklearn.preprocessing.scale()函数，可以直接将给定数据进行标准化。12345678910111213...

逻辑回归使用（参数）

Kyrie_Irving的博客

05-05

1万+

sklearn中的逻辑回归 1、概述 1.1 面试高危问题:Sigmoid函数的公式和性质 Sigmoid函数是一个S型的函数，当自变量z趋近正无穷时，因变量g(z)趋近于1，而当z趋近负无穷时，g(z)趋近于0，它能够将任何实数映射到(0,1)区间，使其可用于将任意值函数转换为更适合二分类的函数。因为这个性质，Sigmoid函数也被当作是归一化的一种方法，与我们之前学过的MinMaxS...

python学习笔记之sklearn数据预处理归一化

qikaihuting的博客

09-11

8243

可参考sklearn_数据处理API帮助理解！标准归一化 归一化到均值为0，方差为1 sklearn.preprocessing.scale函数：Standardize a dataset along any axis 先贴出主要的源码，乍一看，很乱，其实细看之下，就是多了一些判断稀疏矩阵之类的条件性代码。 #coding=utf-8 import numpy as np from...

python归一化sklearn_sklearn标准化,归一化 python熵权法的实现

weixin_39789792的博客

02-04

248

补一下上次文章的坑,有关标准化和归一化的问题.标准化:(X-E(x))/D(x)归一化: (X-min)/(max-min)两个的具体差别我的感受不是特别深刻,用的比较多的是归一化.from sklearn.preprocessing import MinMaxScalermm = MinMaxScaler()mm_data = mm.fit_transform(X)origin_data = m...

Python实现数据归一化：(0,1)标准化、Z-Score与Sigmoid

“python实现几种归一化方法，包括(0,1)标准化、Z-score标准化和Sigmoid函数” 在数据分析和机器学习领域，数据预处理是至关重要的步骤，其中归一化是一种常见的技术，用于调整不同特征之间的尺度，确保它们在模型...