因项目需要,尝试使用scikit-learn的svm训练文本分类器,使用pip install scikit-learn进行安装,因没有指定版本,故安装版本为最新版:scikit-learn==0.24.2
一番处理后,训练后的svm模型在测试集上测试准确率为88.99%;
后来,因为一些原因,把scikit-learn版本降为scikit-learn==0.21.3
同样的数据,同样的训练代码,跑的准确率竟然变为62.97%;
开始,以为是自己不小心改变了什么流程,或者代码,各方查证,的确是没有任何变化,那么,唯一的变化就是scikit-learn版本的变动。。。于是,抱着试一试的心态,重新把scikit-learn版本调整为最新版,重新跑模型,测试,没想到准确率回到了88.99%
吐血。。。事实证明,新版本的scikit-learn在svm模型训练上做了不少优化,以后如果没有版本限制,最好还是使用最新版本的包吧。