skearn中有数据预处理的功能,如fit(),transform()和fit_transform()。
fit(): 求得训练集X的均值,方差,最大值,最小值,这些训练集X固有的属性。
transform(): 在fit的基础上,进行标准化,降维,归一化等操作。
fit_transform(): fit和transform的组合,既包括了训练又包含了转换。可用于给类别打标签,比如有 猫、狗、猪等宠物类别,可直接用这个函数将其转换为0,1,2等。
使用方法
1.fit用法
from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
a1 = [1,6,6,3]
b1 = le.fit(a1)
print(b1.classes_)
输出:[1,3,6]
可以发现,fit函数对原有列表进行去重和升序的操作。
2.transform用法
from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
a1 = [1,6,2]
a2 = le.fit(a1)
b1 = le.transform(a2.classes_)
print(b1)
输出:[0,1,2]
3.fit_transform用法
from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
a1 = [1,6,2]
b1 = le.fit_transform(a1)
print(b1)
输出:[0,1,2]