模型并行
本文通过7个模型分别对数据集进行模型训练。分别是随机森林模型,投票分类器,梯度提升模型,AdaBoost,极限树模型,基于直方图的梯度提升分类树,堆叠分类模型这7个模型。最终同步计算耗费933秒,得出各个模型的准确率为:随机森林模型准确率为90.11 %;投票分类器准确率为86.55 %;AdaBoost准确率为90.15 %;梯度提升模型准确率为90.20 %;极限树模型准确率为89.76 %;基于直方图的梯度提升分类树模型准确率为91.46 %;堆叠分类模型准确率为89.64 %。其中最高的是基于直方图的梯度提升分类树模型。然后再进行模型并行,一共耗费615秒,比之前的快了318秒。通过模型并行加快了算法计算速度,提升了cpu的运行效率。
数据集描述
数据集是txt文件,一共有4个txt文件,分别为 t r a i n _ x . t x t , t r a i n _ y . t x t , t e s