引言 在大致浏览了原文中的最开始的代码发现了几个陌生的、好像和分布式有关的名词——rabit和allreduce。所以这篇文章主要来记录下rabit和allreduce的知识。 什么是rabit rabit是一个库,可以提供allreduce和广播的容错接口。rabit是为了支持分布式机器学习而设计。是支持分布式XGBoost的Backbone库。 rabit的API文档:https://homes.cs.washington.edu/~tqchen/rabit/doc/files.html 之后会主要总结下API文档的内容,未完待续…