数据编码
本章主要是记录python机器学习中数据预处理部分中将非数字处理为数字的两种方式,用于记录
LabelEncoder
用于将非数字转换为数字,顺序编码
notes: 注意只能传一列数据
from sklearn import preprocessing
le = preprocessing.LabelEncoder()
le.fit(data[:,1])
data[:,1]=le.transform(data[:,1])
OneHotEncoder
用于将非数字转换为数字,是离散的,数据可以是任意维度的
from sklearn import preprocessing
enc = preprocessing.OneHotEncoder()
enc.fit(data)
data_parse=enc.transform(data).astype('float32').toarray()