数据的标准化处理——基于python

hence..

已于 2022-11-16 19:16:19 修改

阅读量2.4k

点赞数 1

分类专栏： python 文章标签： python numpy

于 2022-11-16 19:16:16 首次发布

本文链接：https://blog.csdn.net/qq_54423921/article/details/127890923

版权

python 专栏收录该内容

42 篇文章 17 订阅

订阅专栏

数据的标准化处理——基于R

归一化（normalization）
- python实现
标准化
- python实现

之前写过用R来进行标准化：数据的标准化处理——基于R

归一化（normalization）

将数据缩放到[0,1]的（min—max Normalization）
$X^{\ast}=\frac{X_i-X_{min}}{X_{max}-X_{min}}$
通常将上面这种标准化称为归一化
缩放到[-1,1]的 Mean —Normalization
$X^{\ast}=\frac{X_i-mean（X）}{X_{max}-X_{min}}$

python实现

本次用到numpy和scikit-learn两个模块，请自行安装

import  numpy as np
from  sklearn  import  preprocessing

我们先用随机数生成一个十行十列的dataframe

feature=a=np.random.randint(low=10, high=20, size=(10,10))
feature

首先创建缩放器，注意代码里面的range就是我们缩放的范围

#创建缩放器
minmax_scale=preprocessing.MinMaxScaler(feature_range=(0,1))#这里的feature是固定的与数据名无关
scale_feature=minmax_scale.fit_transform(feature)#这里的future就是数据名
print(scale_feature)

输出结果：

完整代码： 没有输出结果请加一个print

import  numpy as np
from  sklearn  import  preprocessing
#%% md

#%%
x=a=np.random.randint(low=10, high=20, size=(10,10))
# feature
#创建缩放器
minmax_scale=preprocessing.MinMaxScaler(feature_range=(0,1))
scale_feature=minmax_scale.fit_transform(x)
scale_feature

标准化

将数据变换为均值为0，标准差为1的分布，并非一定是标准正态的

$X^{\ast}=\frac{X_i-\mu}{\sigma}$

其中μ是均值，σ是标准差
数据的标准化并不会改变原有数据的分布，如果原有数据服从正态分布，则标准化后数据将服从标准正态分布

python实现

还是使用同样的库

import  numpy as np
from  sklearn  import  preprocessing
x=a=np.random.randint(low=10, high=20, size=(10,10))

#创建缩放器
minmax_scale=preprocessing.StandardScaler()
#转换特征
scale_feature=minmax_scale.fit_transform(x)
scale_feature

标准化后的数据

输出标准化后的均值和方差：

print(f"标准化后的均值为{round(scale_feature.mean(),2)},标准化后的均值为{round(scale_feature.std(),3)}")

标准化后的均值为-0.0,标准化后的均值为1.0

一般来说，第二个更常用一些

hence..

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
数据的标准化处理——基于python

本次用到numpy和scikit-learn两个模块，请自行安装。将数据变换为均值为0，标准差为1的分布，并非一定是标准正态的。首先创建缩放器，注意代码里面的range就是我们缩放的范围。标准化后的均值为-0.0,标准化后的均值为1.0。通常将上面这种标准化称为归一化。没有输出结果请加一个print。其中μ是均值，σ是标准差。
复制链接

扫一扫

专栏目录