在数据样本中有一类特征属性彼此是平行的关系,不能简单的以数值或字符赋予其含义。例如 职业:教师 工人 商人...... 面对这种情况可以通过构建哑变量来解决。例如含有三个因子的特征可以将其转化为三列每列都只有0-1构成的向量。这样的向量就是哑变量。下面来看一下再python中的实现 如上为一个含有‘1’,‘2’,‘3’的因子变量 成功转换为哑变量。