【sklearn】非数值标签转换为数值标签 sklearn.preprocessing.LabelEncoder

Enzo 想砸电脑

已于 2023-03-26 15:30:14 修改

阅读量1.4k

点赞数

文章标签： sklearn python 机器学习

于 2022-07-19 09:06:21 首次发布

本文链接：https://blog.csdn.net/weixin_37804469/article/details/125864019

版权

sklearn 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

sklearn.preprocessing.LabelEncoder

作用：将非数值标签转换为数值标签

先看下官方是怎么说的：官方地址

Encode target labels with value between 0 and n_classes-1.
将目标标签的值编码为 1 到 n-1，（一共n个分类）
This transformer should be used to encode target values, i.e. y, and not the input X.
这个转换应该被适用于编码标签的值，比如 y，而不是用于编码输入值，比如 x

举例

import numpy as np
import pandas as pd
import sklearn.preprocessing as preprocessing

city = pd.Series(["paris", "paris", "tokyo", "amsterdam"])

le = preprocessing.LabelEncoder()
le.fit(city)
list(le.classes_) # 查看标签去重后的类别
# ['amsterdam', 'paris', 'tokyo']

# 标签值转化，可以理解为，将非数字标签映射到数字标签
le.transform(city)
# 输出为： array([1, 1, 2, 0])

# 反转化，将数字标签还原为非数字标签
list(le.inverse_transform([1, 1, 2, 0]))
# ['tokyo', 'tokyo', 'paris']