sklearn.preprocessing.LabelEncoder
对标签进行标准化,将字符串标签转换成从 0 开始的数字类标签。另外,该方法还可以反转标签,即将数字处理成字符串。当然,你也可以自己写一个判断语句来将字符串标签数值化。
该方法对特征进行硬编码不仅可以使用pandas的 factorize函数将文本特征进行编号,也可以使用sklearn 的LabelEncoder函数,两者的效果几乎是一样的。编码为0~n-1(n为种类数)
data_name中为:dog,dog,cat,dog等列表
from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
le.fit(['cat', 'dog'])
data_label = le.transform(data_name)
ptint(data_label)
输出:
array([1, 0, 0, ..., 1, 0, 0])