[数据预处理] onehot编码:是什么,为什么,怎么样

本文介绍了onehot编码的概念,解释了为何需要对离散标签和特征进行onehot编码,强调了编码对保持类别间距离平等和避免损失函数计算问题的重要性,并提供了一个简单的onehot编码示例。
摘要由CSDN通过智能技术生成

[数据预处理] onehot编码:是什么,为什么,怎么样

什么是onehot编码

在机器学习算法中,我们经常会遇到离散化的特征或标签

one-hot编码,又称“独热编码”。其实就是用N位状态寄存器编码N个状态,每个状态都有独立的寄存器位,且这些寄存器位中只有一位有效,说白了就是只能有一个状态


为什么要进行onehot编码

对labels进行onehot编码的原因

对于离散化标签进行onehot编码的原因,是因为如果仅仅对原始的离散标签,比如图数据集Cora数据集的标签(‘Genetic_Algorithms’, ‘Probabilistic_Methods’, ‘Reinforcement_Learning’, ‘Neural_Networks’, ‘Theory’, ‘Case_Based’, ‘Rule_Learning’),仅仅用(1,2,3,4,5,6,7)对labels进行编码

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值