特征工程 处理类别类型特征 One-Hot Encoding 和LabelEncoder 区别

LabelEncoder可以将[中国,美国,日本]转化为[0,1,2],但这样会出现一个问题:中国和日本的平均会等于日本。 决策树、随机森林算法等可以直接处理这样的类别类型特征,并且这种方法使用的特征空间很少。 One-Hot Encoding优势很明显,更容易被机器所正确理解,但高维度是个严重的...

2018-11-24 16:49:46

阅读数 138

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭