【机器学习】数据预处理 | Normalizer（L1正则化）| StandardScaler（标准化正态化）| MinMaxScaler（调整尺度，映射到（0,1））| 二值化Binarizer

今天一定要洛必达

已于 2022-10-03 10:48:49 修改

阅读量547

点赞数

分类专栏：机器学习文章标签：机器学习 python 人工智能

于 2022-09-18 16:40:03 首次发布

本文链接：https://blog.csdn.net/weixin_46274756/article/details/126919463

版权

机器学习专栏收录该内容

8 篇文章 0 订阅

订阅专栏

一、数据L1正则化

以鸢尾花为例子

#数据预处理——数据L1正则化
import pandas as pd
from sklearn.preprocessing import Normalizer
file_name='E:/数学建模2022/算法/数据预处理/iris.csv'
names=['separ-length','separ-width','petal_length','petal_width','class']
f=open(file_name)#因为中文要报错，所以多了这么一个步骤
data=pd.read_csv(f,names=names)
data=data.values
X = data[:,:4] #输入特征
Y = data[:,4] #标签（输出特征）
transformer=Normalizer().fit(X)
newX=transformer.transform(X)
print(newX)

归一化前的数据：
在这里插入图片描述
归一化后的数据：

二、数据标准化

import pandas as pd
from sklearn.preprocessing import Normalizer,StandardScaler
file_name='D:/数学建模2022/算法/数据集观察/iris.csv'
names=['separ-length','separ-width','petal_length','petal_width','class']
f=open(file_name)#因为中文要报错，所以多了这么一个步骤
data=pd.read_csv(f,names=names)
data=data.values
X = data[:,:4] #输入特征
Y = data[:,4] #标签（输出特征

transformer2=StandardScaler().fit(X)
newX2=transformer2.transform(X)
print(newX2)

标准化后的数据：
在这里插入图片描述

三、数据归一化（映射到0,1）

import pandas as pd
from sklearn.preprocessing import Normalizer,StandardScaler,MinMaxScaler
file_name='D:/数学建模2022/算法/数据集观察/iris.csv'
names=['separ-length','separ-width','petal_length','petal_width','class']
f=open(file_name)#因为中文要报错，所以多了这么一个步骤
data=pd.read_csv(f,names=names)
data=data.values
X = data[:,:4] #输入特征
Y = data[:,4] #标签（输出特征

transformer3=MinMaxScaler()
newX2=transformer3.fit_transform(X)
print(newX2)

映射到0,1后：
在这里插入图片描述

四、数据二值化

import pandas as pd
from sklearn.preprocessing import Binarizer
file_name='D:/数学建模2022/算法/数据集观察/iris.csv'
names=['separ-length','separ-width','petal_length','petal_width','class']
f=open(file_name)#因为中文要报错，所以多了这么一个步骤
data=pd.read_csv(f,names=names)
data=data.values
X = data[:,:4] #输入特征
Y = data[:,4] #标签（输出特征

transformer4=Binarizer(threshold=4.5).fit(X)
newX4=transformer4.transform(X)
print(newX4)