pandas中的get_dummies和sklearn中的OneHotEncoder()的结果是一样的。
但是区别就在于,OneHotEncoder()适用于多个集合的情况,如:训练集和测试集;而get_dummies只适用于一个数据集情况。
sklearn中的OneHotEncoder()在训练集上得到的编码器是需要再用于测试集中相应的数据上的,所以OneHotEncoder()有两个方法,1. fit_transform(), 2. transform(),也就是说这两个集合使用的是同一套编码。
而get_dummies不能这样操作,只能用于一个数据集上数据的转换。