sklearn数据预处理（三）归一化

最新推荐文章于 2024-06-28 08:40:32 发布

Rich Dad

最新推荐文章于 2024-06-28 08:40:32 发布

阅读量2.4k

点赞数 2

分类专栏：西行日记笔记文章标签： sklearn 机器学习 python

I love 段奥娟

本文链接：https://blog.csdn.net/qq_44745905/article/details/121156306

版权

本文介绍了数据预处理中的归一化方法，包括L1和L2范式归一化。归一化能提升模型训练速度，统一特征量纲，并在sklearn库中提供了实现方式。

摘要由CSDN通过智能技术生成

时间煮雨
@R星校长

第3关：归一化

任务描述

本关任务：利用sklearn对数据进行归一化。

相关知识

为了完成本关任务，你需要掌握：1.为什么使用归一化，2.L1范式归一化，3.L2范式归一化。

为什么使用归一化

归一化是缩放单个样本以具有单位范数的过程。归一化实质是一种线性变换，线性变换有很多良好的性质，这些性质决定了对数据改变后不会造成“失效”，反而能提高数据的表现，这些性质是归一化的前提。归一化能够加快模型训练速度，统一特征量纲，避免数值太大。 值得注意的是，归一化是对每一个样本做转换，所以是对数据的每一行进行变换。 而之前我们讲过的方法是对数据的每一列做变换。

L1范式归一化

L1范式定义如下：
在这里插入图片描述

表示向量x中每个元素的绝对值之和。
L1范式归一化就是将样本中每个特征除以特征的L1范式。

在sklearn中使用normalize方法实现，用法如下：

from sklearn.preprocessing import normalize

data = np.array([[-1,0,1],
                 [1,0,1],
                 [1,2,3]])
data = normalize(data,'l1')

>>>data
array<