sklearn数据预处理(三)归一化

本文介绍了数据预处理中的归一化方法,包括L1和L2范式归一化。归一化能提升模型训练速度,统一特征量纲,并在sklearn库中提供了实现方式。
摘要由CSDN通过智能技术生成

时间煮雨
@R星校长

3关:归一化

任务描述

本关任务:利用sklearn对数据进行归一化。

相关知识

为了完成本关任务,你需要掌握:1.为什么使用归一化,2.L1范式归一化,3.L2范式归一化。

为什么使用归一化

归一化是缩放单个样本以具有单位范数的过程。归一化实质是一种线性变换,线性变换有很多良好的性质,这些性质决定了对数据改变后不会造成“失效”,反而能提高数据的表现,这些性质是归一化的前提。归一化能够加快模型训练速度,统一特征量纲,避免数值太大。 值得注意的是,归一化是对每一个样本做转换,所以是对数据的每一行进行变换。 而之前我们讲过的方法是对数据的每一列做变换。

L1范式归一化

L1范式定义如下:
在这里插入图片描述

表示向量x中每个元素的绝对值之和。
L1范式归一化就是将样本中每个特征除以特征的L1范式。

sklearn中使用normalize方法实现,用法如下:

from sklearn.preprocessing import normalize

data = np.array([[-1,0,1],
                 [1,0,1],
                 [1,2,3]])
data = normalize(data,'l1')

>>>data
array<
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值