验证利用numpy和sklearn方法进行标准化的结果是否一致

佐佑思维

于 2021-07-21 22:25:27 发布

阅读量295

点赞数

分类专栏： Python数学算法文章标签： python 数据分析机器学习算法

本文链接：https://blog.csdn.net/weixin_45288557/article/details/118978061

版权

Python数学算法专栏收录该内容

23 篇文章 5 订阅

订阅专栏

本文介绍了数据预处理中的标准规范化方法，包括标准化公式、使用`numpy`库的`np.mean`和`np.std`函数进行计算，以及利用`sklearn.preprocessing.StandardScaler()`进行数据标准化。通过这三个步骤，确保数据的均值为0，标准差为1，从而统一不同特征的尺度。

摘要由CSDN通过智能技术生成

1 标准化公式

$\frac{(Sample - mean)}{std}$

计算时对每个属性/每列分别进行

Sample是一个(n_samples, n_features) 的数组，行代表有几组样本，列表示属性特征

2 利用`np.mean`,`np.std`进行计算

对其中一列属性进行计算并对比：

(Sample[:,0]-np.mean(Sample[:,0]))/np.std(Sample[:,0])

在这里插入图片描述

3 利用`preprocessing.StandardScaler()`进行计算

scaler =  preprocessing.StandardScaler().fit(Sample)
Sample_scaled = scaler.transform(Sample)  #标准化后的数据
print(Sample_scaled[:,0])

在这里插入图片描述
结果是一致的！

验证利用numpy和sklearn方法进行标准化的结果是否一致

目录

1 标准化公式

2 利用np.mean,np.std进行计算

3 利用preprocessing.StandardScaler()进行计算

2 利用`np.mean`,`np.std`进行计算

3 利用`preprocessing.StandardScaler()`进行计算