sklearn快速入门教程：归一化

Erick Yu

已于 2022-09-22 16:10:01 修改

阅读量814

点赞数 1

文章标签： sklearn python 人工智能

于 2022-08-09 20:23:15 首次发布

本文链接：https://blog.csdn.net/ykrsgs/article/details/126247857

版权

0-150归一化到0-100

MinMaxScaler

缺点：

新数据加入时可能会改变数据的min或max值

实现1：

from sklearn.preprocessing import MinMaxScaler

data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
#实例化
scaler = MinMaxScaler() #如果（）内为空，MinMaxScaler会把原数据归一化到默认值：[o,1]范围内
scaler.fit(data) #生成了min&max

result = scaler.transform(data) #通过transform接口导出归一化结果
result

array([[0.  , 0.  ],
       [0.25, 0.25],
       [0.5 , 0.5 ],
       [1.  , 1.  ]])

解析：

通过下面的代码可见data：

data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
import pandas as pd
pd.DataFrame(data)

再看array的运行结果，可见：

data中0、1两列提供的信息量是一样的。

其实倒数第三、第二行的代码可以合起来写成

result = scaler.fit_transform(data)

其运行结果是一样的

与之对应的可以将运行结果逆转回原数据

scaler.inverse_transform(result)

array([[-1. ,  2. ],
       [-0.5,  6. ],
       [ 0. , 10. ],
       [ 1. , 18. ]])

实现2

from sklearn.preprocessing import MinMaxScaler

data = [[-1, 2], [-0.5, 6], [0, 10], [1, 18]]
#实例化
scaler = MinMaxScaler(feature_range = [5, 10]) #把原数据归一化到：[5,10]范围内
scaler.fit(data) #生成了min&max

result = scaler.transform(data) #通过transform接口导出归一化结果
result

array([[ 5.  ,  5.  ],
       [ 6.25,  6.25],
       [ 7.5 ,  7.5 ],
       [10.  , 10.  ]])

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Erick Yu

关注关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
sklearn快速入门教程：归一化

。
复制链接

扫一扫

Sklearn标准化和归一化方法汇总(3)：范数归一化

Laurence 的技术博客

01-18

2257

范数归一化的计算逻辑是：先计算出一个向量（通常是一行）的范数（如无特殊说明，通常都是指L-2范数），然后让向量中的每一个元素除以这个范数，得到的新向量就是范数归一化后的结果。所以，了解范数归一化的原理关键是要理解：什么是范数？我们已经在此前以前文章中专门做了介绍，请参考《范数的意义与计算方法》一文。

【数据预处理】sklearn实现数据预处理（归一化、标准化）

在热爱技术的路上一直前行。

05-16

6546

1. 为什么需要归一化/标准化？原因：特征的单位或者大小相差较大，或者某特征的方差相比其他的特征要大出几个数量级，容易影响（支配）目标结果，使得一些算法无法学习到其他的特征，即无量纲化。 2. 归一化 2.1 定义通过对原始数据进行变换把数据映射到(默认为[0,1])之间 2.2 公式作用于每一列，max为一列的最大值，min为一列的最小值,那么X’’为最终结果，mx，mi分别为指定区间值默认mx为1,mi为0 2.3 sklearn中的Minmax归一化API sklearn.prepro

参与评论您还未登录，请先登录后发表或查看评论

sklearn的归一化函数normalize

qq_31225201的博客

03-15

6142

理论解释对于p-范数，对于x向量：向量x的p-范数为：因此，可得到L0、L1、L2范数分别为： L0范数是指向量中非0的元素的个数 L1范数是指向量中各个元素绝对值之和 L2范数是指向量各元素的平方和然后求平方根（开根号） L1范数可以进行特征选择，得到稀疏矩阵，仅仅有少量值为非0，这些就是提取出来的特征。 L2范数可以防止过拟合，提升模型的泛化能力，得到的值很小，但不会到0。TiBA6K6p5oiR5a6J6Z2Z5Lya,size_20,color_FFFFFF,t_70,g_se,x_16

关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化

Elvirangel的博客

02-26

641

【原】关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化【原】关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化一、标准化（Z-Score），或者去除均值和方差缩放公式为：(X-mean)/std 计算时对每个属性/每列分别进行。将数据按期属性（按列进行）减去其均值，并处以其方差。得到的结果是，对于每个属性/每列来说所有数据都聚集在0附近，方差为1...

特征工程系列：特征预处理（上）

weixin_30736301的博客

08-13

248

特征工程系列：特征预处理（上）关于作者：JunLiang，一个热爱挖掘的数据从业者，勤学好问、动手达人，期待与大家一起交流探讨机器学习相关内容~ 0x00 前言数据和特征决定了机器学习的上限，而模型和算法只是逼近这个上限而已。由此可见，特征工程在机器学习中占有相当重要的地位。在实际应用当中，可以说特征工程是机器学习成功的关键。那特征工程是什么？特征工程是利用数据领域...

使用sklearn进行对数据标准化、归一化以及将数据还原的方法

09-20

今天小编就为大家分享一篇使用sklearn进行对数据标准化、归一化以及将数据还原的方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

用sklearn进行数据预处理：缺失值处理、数据标准化、归一化.pdf

04-04

用sklearn进行数据预处理：缺失值处理、数据标准化、归一化.pdf

EXPLORING_SKLEARN:探索sklearn:glowing_star:

05-26

learn Sklearn的功能监督学习模型无监督学习模型聚类降维合奏方法特征提取功能选择开源的 :diamond_with_a_dot: 第一天：Sklearn建模过程：加载，拆分数据训练模式模型持久性预处理数据集（二值化，均值去除，缩放...

NBR:归一化燃烧率

03-06

丁腈橡胶 归一化燃烧率光栅 matplotlib 麻木该脚本根据卫星图像计算NBR并返回发射区域。

数据归一化和其在sklearn中的处理

weixin_34025051的博客

09-01

1443

打开微信扫一扫，关注微信公众号【数据与算法联盟】转载请注明出处：http://blog.csdn.net/gamer_gyt 博主微博：http://weibo.com/234654758 Github：https://github.com/thinkgamer 一：数据归一化 数据归一化（标准化）处理是数据挖...

python深度学习stadardscalar fit_transform数据处理、contrib使用、Session多种创建、in_top_k、argmax、equal、cas、extend map

yangdeshun888的博客

10-11

1391

1、StadardScalar()与fit_transform() 其StadardScalar是去均值和进行方差归一化，其是对数据的每一个特征维度进行的操作，即对所有最小的元素进行操作，而不是针对一个样本。其要完成这个功能需要配合fit_transform()函数进行。其实例代码如下： # coding=utf-8 # 统计训练集的 mean 和　std 信息 from sklea...

sklearn特征预处理：归一化和标准化

qq_39375237的博客

11-17

771

sklearn特征预处理：归一化和标准化特征预处理：通过一些转换函数，将特征数据转换成更加适合算法模型的特征数据。API：sklearn.preprocessing 数值型数据的无量纲化： 1、归一化：x_new = (x - min)/(max - min)，如果将其映射到指定的区间(a，b)，则：x_new_new = x_new * (b-a) + a，一般是映射到(0，1)，则：x_new_new = x_new。 归一化的缺点：如果数据中有异常值（最大值和最小值），影响比较大，鲁棒性比较差。 2

Sklearn中数据预处理

sshi9的博客

03-05

5012

数据预处理 Sklearn中的模块preprocessing：几乎包含数据预处理的所有内容数据无量纲化在机器学习算法实践中，我们往往有着将不同规格的数据转换到同一规格，或不同分布的数据转换到某个特定分布的需求，这种需求统称为将数据“无量纲化”。数据的无量纲化可以是线性的，也可以是非线性的。线性的无量纲化包括中心化（Zero-centered或者Mean subtraction）处理和缩放处理（Scale）。中心化的本质是让所有记录减去一个固定值，即让数据样本数...

最大值最小值归一化&标准归一化（均值归一化，标准归一化）

h2728677716的博客

02-15

1万+

最大值最小值归一化 Xjmin是Xj所在列的最小值 Xjmax是Xj所在列的最大值问题：能做到归一化（0-1zhi之间），但是一旦数据中有一个离群值（特别大的值）就会出现这个离群值做完归一化后特别趋近于1，而其他值特别趋近于0 标准归一化 经过处理的数据符合标准正态分布即均值为0,标准差为1 Xmean：X所在列的均值 Standard Deviation：X所在列的标准差标准差的公式会考虑到所有样本数据，所以受离群值影响会小一些。但是如果使用标准归一化不一定会把

python学习笔记之sklearn数据预处理归一化

qikaihuting的博客

09-11

8184

可参考sklearn_数据处理API帮助理解！标准归一化 归一化到均值为0，方差为1 sklearn.preprocessing.scale函数：Standardize a dataset along any axis 先贴出主要的源码，乍一看，很乱，其实细看之下，就是多了一些判断稀疏矩阵之类的条件性代码。 #coding=utf-8 import numpy as np from...

归一化与标准化

Baimoc

09-07

4463

一、归一化 对原始数据缩放到 0-1 之间，是线性变换。也叫最大最小标准化，离散标准化。区间也可以设置为其他，一般为 0 - 1。公式： X=x−minmax−min X = \frac{x-min}{max-min } X=max−minx−min min 为数据最小值，max 为数据最大值，x 为原始数据值，X 为归一化后的值。 x=X′(max−min)+min x = X^{\prime}(max-min)+min x=X′(max−min)+min 特点虽然归一化可以保留原始数据中存在的关

机器学习(5.sklearn归一化以及标准化)

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交