标准化、归一化等的适用范围

本文介绍了特征处理中的标准化和归一化,包括它们的计算方法、适用范围以及不同情况下的选择。标准化适合数据存在异常值和噪音的情况,而归一化适用于对输出范围有要求的场景。在某些模型如SVM、KNN和神经网络中,标准化通常是首选。文章还提到,在数据集规模变化时,标准化的稳定性优于归一化。
摘要由CSDN通过智能技术生成

特征处理方法总览:

在这里插入图片描述

标准化和归一化介绍:

(1)标准化
  标准化需要计算特征的均值和标准差,公式表达为:
在这里插入图片描述
  使用preproccessing库的StandardScaler类对数据进行标准化的代码如下

from sklearn.preprocessing import StandardScaler
from sklearn.datasets import load_iris
iris=load_iris()
#标准化,返回值为标准化后的数据
StandardScaler().fit_transform(iris.data)

(2)归一化
在这里插入图片描述
使用preproccessing库的Normalizer类对数据进行归一化的代码如下:

from sklearn.preprocessing import Normalizer
#归一化,返回值为归一化后的数据
Normalizer().fit_transform(iris.data)

区间缩放法其实是归一化的一种:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值