Sklearn学习_02数据的预处理

最新推荐文章于 2022-03-05 13:53:16 发布

取啥名字好�

最新推荐文章于 2022-03-05 13:53:16 发布

阅读量314

点赞数 1

分类专栏： Sklearn 文章标签： sklearn 数据挖掘建模数据的标准化数据预处理

本文链接：https://blog.csdn.net/student_thon/article/details/89459749

版权

对单个数据进行标准化

函数介绍

sklearn.preprocessing.scale(
X：{array-like, sparse matrix}, 需要进行变换的数据阵
axis=0：指分别按照列(0)或是整个样本(1)计算均数、标准差并进行变换
注意：在sklearn中没有按行计算均数的，若有需要则需将此矩阵进行转置。然后再进行列变化，最后再转置回原样即可
with_mean=True：是否中心化数据（移除均数）
with_std=True：是否均一化标准差（除以标准差）
copy=True：是否生成副本而不是替换原数据
)

代码解释

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
from sklearn import datasets
boston = datasets.load_boston()
bostondf = pd.DataFrame(boston.data, columns=boston.feature_names)
# 查看原始数据，默认显示前5行
bostondf.head()

运行结果：
在这里插入图片描述

bostondf.describe()

对表格中的数据进行描述，结果如下：
在这里插入图片描述
以CRIM这一列为例，用sklearn对该列做数据的标准变换

from sklearn import preprocessing
# 对数据进行标化，做标准正太变换
x_scaled = preprocessing.scale(bostondf)
# 取出数据的前两行
x_scaled[:2]

结果如下
在这里插入图片描述

# 计算转换后的均数和标准差
x_scaled.mean(axis=0), x_scaled.std(axis=0)

在这里插入图片描述
从上图可以看出，每一列的均数都非常接近于0，标准差都为1。显然每一列都进行了标化

# 对整个矩阵统一做标化
X_scaled1 = preprocessing.scale(bostondf, axis=1)
X_scaled1[:2]

结果如下
在这里插入图片描述

# 分列进行计算
X_scaled1.mean(axis=0), X_scaled1.std(axis=0)

最低0.47元/天解锁文章

取啥名字好�

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Sklearn学习_02数据的预处理

1
复制链接

扫一扫

专栏目录

Sklearn学习_02数据的预处理

对单个数据进行标准化

“相关推荐”对你有帮助么？