pandas 中get_dummies() 与factorize()的区别 当一个特征中存在较多的类别时,使用get_dummies() 会导致DataFrame中的columns 列数激增factorize() 可以对特征中的类别创建一些数字,来表示分类变量或者枚举型变量(enumerated type)。具体来说:factorize() 只产生一个特征变量,这个特征中对类别使用数字进行区分。适用于出现较多独立变量的情况 参考 e.p.