机器学习Label Encoder和One Hot Encoder

本文介绍了在机器学习中,如何使用Label Encoder和One Hot Encoder对分类数据进行编码。Label Encoder将文本转换为数值,但可能导致顺序误解。为解决此问题,文章推荐使用One Hot Encoder,它将每个类别表示为单独的一列,用0和1表示,避免了顺序关系的错误解读。通过实例展示了编码过程。
摘要由CSDN通过智能技术生成

标签编码(Label Encoder)

 

 

 

在本例中第一列是Country, 如果我们要运行任何模型, 数据中不能包含文本

所以要对文本进行处理

接下来,我们从sklearn库中导入LabelEncoder类

 

from sklearn.preprocessing import LabelEncoder

labelencoder = LableEncoder()

X[:, 0] = labelencoder.fit_transform(X[:, 0])

 

 

假设数据在X变量中,运行代码后,检查X的值,发现国家已经被1, 2, 3取代

 

 

 

 

 

Label Encoder的问题:

我们将一组国家名称编码成数据,实际上是分类数据,数据与数据之间

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值