- 博客(1)
- 资源 (1)
- 收藏
- 关注
原创 类别特征的独热编码和二进制编码
我们在建模之前,一般需要对数据进行预处理。对于分类变量,一般模型不能直接作为变量输入,需要进行编码。分类变量常用编码方式如下:有序变量:序号编码无序变量:独热编码、二进制编码下面为大家介绍独热编码和二进制编码之间的区别。1)独热编码:独热编码会将变量的不同取值(N种取值)分别赋予一个只有1位为0的N维向量。例如星期,共有7个取值,独热编码会把它编码成一个7维稀疏向量。星期一表示为(...
2019-09-23 19:28:30 3373
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人