sklearn数据标准化

最新推荐文章于 2024-07-30 20:31:43 发布

SDUT_wdc

最新推荐文章于 2024-07-30 20:31:43 发布

阅读量1.4k

点赞数

分类专栏：机器学习

机器学习专栏收录该内容

10 篇文章 3 订阅

订阅专栏

#encoding:utf-8
'''''
Created on 2015年10月13日
@author: ZHOUMEIXU204
'''
#sklearn数据标准化，数据标准化有三种
#第一种是Z-Score，或者去除均值和方差缩放
from sklearn import preprocessing
import numpy as np
x=np.array([[1.,-1.,2.],
[2.,0.,0.],
[0.,1.,-1.]])
x_scaled=preprocessing.scale(x)
x_scaled.mean(axis=0)
x_scaled.std(axis=0)
# 使用sklearn.preprocessing.StandardScaler类，
# 使用该类的好处在于可以保存训练集中的参数（均值、方差）
# 直接使用其对象转换测试集数据。
scaler=preprocessing.StandardScaler().fit(x)
scaler.mean_
scaler.std_
scaler.transform(x) #跟上面的结果是一样的
#第二种是将属性缩放到一个指定范围,也是就是(x-min)/(max-min)
#依赖于preprocessing中的MinMaxScaler类
x_train=np.array([[1.,-1.,2.],
[2.,0.,0.],
[0.,1.,-1.]])
min_max_scaler=preprocessing.MinMaxScaler()
x_train_minmax=min_max_scaler.fit_transform(x_train)
print(x_train_minmax)
# 当然，在构造类对象的时候也可以直接指定最大最小值的范围：feature_range=(min, max)，此时应用的公式变为：
# x_std=(X-X.min(axis=0))/(X.max(axis=0)-X.min(axis=0))
# x_scaled=X_std/(max-min)+min
#第三种是正则化Normalization
x=np.array([[1.,-1.,2.],
[2.,0.,0.],
[0.,1.,-1.]])
x_normalized=preprocessing.normalize(x,norm='l2')
print(x_normalized)
# 可以使用processing.Normalizer()类实现对训练集和测试集的拟合和转换
normalizer=preprocessing.Normalizer().fit(x)
print(normalizer)
normalizer.transform(x)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

SDUT_wdc

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Sklearn标准化和归一化方法汇总(1)：标准化 / 标准差归一化 / Z-Score归一化

Laurence的技术博客

01-17

4449

标准化 / 标准差归一化 / Z-Score归一化的算法是：先求出数据集（通常是一列数据）的均值和标准差，然后所有元素先减去均值，再除以标准差，结果就是归一化后的数据了。经标准差归一化后，数据集整体将会平移到以0点中心的位置上，同时会被缩放到标准差为1的区间内。要注意的是数据集的标准差变为1，并不意味着所有的数据都会被缩放到[-1,1]之间，下文有示例为证。

sklearn 标准化

weixin_42568012的博客

01-02

931

标准化目的：去除数据量纲的影响提高模型的解释性加快模型收敛速度 标准化的方法：中心化：减去均值再除以标准差 01标准化：减去最小值再除以最大值与最小值的差 # sklearn 中标准化的方法 from sklearn.preprocessing import StandardScaler #中心化 from sklearn.preprocessing import MinMaxSc...

参与评论您还未登录，请先登录后发表或查看评论

sklearn实现数据标准化（Standardization）和归一化（Normalization）

asddoa的博客

02-04

2413

sklearn的标准化过程，即包括Z-Score标准化，也包括0-1标准化，并且即可以通过实用函数来进行标准化处理，同时也可以利用评估器来执行标准化过程。

层次特征的标准化：sklearn中的高级数据预处理技术

热门推荐

爱丹丹的博客

10-24

1万+

sklearn.preprocessing是sklearn库中非常重要的一个module，集成了很多预处理数据的方法，今天对常用的几个加以解释说明。二值化 sklearn.preprocessing.binarizer(threshold=0.0, copy=True) 对数据根据给定的阈值将其映射到0和1，其中阈值默认为0.0，可接收float类型的阈值，注意数据大于阈值的时候映射为1，小于等...

Sklearn上机笔记--标准化

WSY_nian的博客

09-25

2361

数据挖掘sklearn上机笔记：标椎化、正则化相关

使用sklearn进行对数据标准化、归一化以及将数据还原的方法

12-25

标准化后的数据的均值＝0，标准差＝1，因而标准化的数据可正可负。二、使用sklearn进行标准化和标准化还原原理：即先求出全部数据的均值和方差，再进行计算。最后的结果均值为0，方差是1，从公式就可以看出。 ...

sklearn数据标准化的4个问题

pleasure的博客

10-12

1797

sklearn的数据标准化的4个问题数据标准化是机器学习建模之前的常见操作，可以减小不同特征的数据量纲的影响。在机器学习数据处理过程中，笔者整理了4个常见的问题：问题1：fit和transform的流程问题2：标准化，归一化和鲁棒化的三种处理方式的运算方式和手动代码编写。问题3：面对K折交叉验证时，先对所有数据集统一标准化，还是在每一折内，分别对训练集标准化作用到各自测试集。问题4：数据标准化场景。 1.标准化流程在sklearn中，数据标准化与模型类似。可以通过fit再transform

sklearn 数据标准化与反标准化

09-11

数据标准化是将数据按照一定规则进行转换，使得数据在特定范围内变化，常用的方法有 Z-score 标准化和 Min-Max 标准化。 Z-score 标准化通过对数据进行均值减法和标准差除法来使数据服从标准正态分布，公式为： z ...

sklearn 数据标准化 StandardScaler

weixin_44360866的博客

08-18

720

sklearn StandardScaler

sklearn快速入门教程：标准化

Ryan-Yu的博客

08-09

2073

、

Sklearn标准化和归一化方法汇总(2)：Min-Max归一化

Laurence的技术博客

01-17

5179

Min-Max归一化的算法是：先找出数据集通常是一列数据）的最大值和最小值，然后所有元素先减去最小值，再除以最大值和最小值的差，结果就是归一化后的数据了。经Min-Max归一化后，数据集整体将会平移到[0,1]的区间内，数据分布不变。

python——机器学习：sklearn数据预处理preprocessing标准化、归一化和纠偏

weixin_53848907的博客

05-31

3096

前段时间参加了一个数据建模比赛，机器学习部分主要是应用python的sklearn库，现整理一下自己当时的复习内容。整个数据建模的第一部分也是最主要的部分是数据预处理。其常规顺序（不一定全需要做）为：处理离群值、处理缺失值、标准化或归一化、纠偏、连续特征离散化、类别特征编码、特征增强和对不平衡数据集的处理（仅针对分类问题）。本篇是数据预处理中的数据标准化或归一化和纠偏部分。

Python-sklearn数据预处理（单/多个数据集数据标准化、稳健标准化、缺失值填补）

rettbbetter的博客

02-05

3023

sklearn数据预处理部分，其中包括不同情况下的数据标准化以及遇到异常值（稳健标准化）或缺失值（缺失值填补）情况该如何对数据进行处理，简单复习上篇笔记sklearn三板斧

【机器学习笔记】【数据预处理】

芊樱烛渊的博客

09-16

2977

对于StandardScaler和MinMaxScaler来说，空值NaN会被当做是缺失值，在fit的时候忽略，在transform的时候保持缺失NaN的状态显示。并且，尽管去量纲化过程不是具体的算法，但在fit接口中，依然只允许导入至少二维数组，一维数组导入会报错。通常来说，我们输入的X会是我们的特征矩阵，现实案例中特征矩阵不太可能是一维所以不会存在这个问题。（通常来说我们现实输入的特征矩阵都是一维以上的数据）

scikit-learn数据标准化

weixin_52075272的博客

10-24

190

五种标准化：StandardScaler, MinMaxScaler, RobustScaler, MaxAbsScaler, Normalizer

机器学习好伙伴之scikit-learn的使用——Normalization标准化

Bubbliiiing的学习小课堂

09-05

2309

机器学习好伙伴之scikit-learn的使用——Normalization标准化什么是标准化sklearn中标准化的实现利用scale计算零均值单位方差利用MinMaxScaler进行最小最大值标准化应用示例在进行训练与测试的时候，需要对数据进行标准化，提高准确度。什么是标准化 数据的标准化（normalization）是将数据按比例缩放，使之落入一个小的特定区间。其目的是去除数据的单位限...