读热编码,又称哑编码,是将定性数据编码为定量数据,在机器学习中广泛用于对离散型的分类数据预处理操作。如特征性别,即可分为三类:男、女和其他。用计算机二进制表达([1,0,0],[0,1,0],[0,0,1]).
在python中的调用函数如下:
from sklearn.preprocessing import OneHotEncoder
clf = OneHotEncoder()
clf.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1
读热编码,又称哑编码,是将定性数据编码为定量数据,在机器学习中广泛用于对离散型的分类数据预处理操作。如特征性别,即可分为三类:男、女和其他。用计算机二进制表达([1,0,0],[0,1,0],[0,0,1]).
在python中的调用函数如下:
from sklearn.preprocessing import OneHotEncoder
clf = OneHotEncoder()
clf.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1