将分类变量转化为虚拟变量,是指将分类变量转化为多个二元变量(即指示变量)。这样做的原因是,许多机器学习算法不能直接处理分类变量,但是能够处理数值变量。
例如,假设有一个分类变量,它有三个可能的值:A、B 和 C。我们可以创建三个新的二元变量,分别表示 A、B 和 C 是否存在。这些变量可以被称为虚拟变量,因为它们只是表示原始分类变量的“虚拟”版本。
例如,假设有一个分类变量,它有三个可能的值:A、B 和 C。我们可以创建三个新的二元变量,分别表示 A、B 和 C 是否存在。这些变量可以被称为虚拟变量,因为它们只是表示原始分类变量的“虚拟”版本。
例如: 原始分类变量:A、B、C 虚拟变量:A_dummy、B_dummy、C_dummy
A_dummy=1,表示原始分类变量值为 A。 A_dummy=0,表示原始分类变量不是 A。
B_dummy 和 C_dummy 同理。