1.随机森林:
概要:记录一些在运用随机森林模型中遇到的问题
1.特征抽取:–DictVectorizer
在一段随机森林模型的代码中,使用了DictVectorizer()对训练集和测试集进行处理,模型训练结束后,在测试集上分类准确率为1,然而自己画出预测图,却与实际数据相差很多,不知道问题出在哪,找了很久。
究其原因,是因为之前拷贝的随机森林案例中,在训练模型之前对训练集和测试集进行了莫名其妙的DictVectorizer()处理,而自己画图预测时却没有对数据进行这样处理,导致结果的误差。这里,记录一下特征抽取DictVectorizer()的含义及用法:
搬运博文:特征抽取DictVectorizer()