我在做数据的特征处理的时候,需要对类别数据进行整数编码。结果出现如下错误:
TypeError: Encoders require their input to be uniformly strings or numbers. Got ['float', 'int', 'str']
这个错误通常是因为在使用编码器对数据进行处理时,输入的数据类型不一致。解决方案就是将所有的数据统一转换为同一数据类型,比如将所有数据转换为字符串或数值。
原代码
from sklearn.preprocessing import LabelEncoder
label_encoder = LabelEncoder()
for col in cols:
df3[col] = label_encoder.fit_transform(df3[col])
其中,cols为需要转换的类别数据所在列的列名组成的列表,df3为整个数据的dataFrame。
修改之后
from sklearn.preprocessing import LabelEncoder
label_encoder = LabelEncoder()
for col in cols:
df3[col] = df3[col].astype(str)
df3[col] = label_encoder.fit_transform(df3[col])