苦逼研究生生活开始了,做Giraph平台的优化。记录一下垃圾小白从0开始学Giraph。
Giraph工作基本构成
Giraph 作业是通过传递一个 Giraph Configuration 对象来创建的,该对象包含 Giraph 用于执行作业的不同属性。主要属性是包含 compute()方法的计算类。该计算方法应用于每一个超步中的所有活顶点。Giraph 还需要知道输入数据的位置,以及如何读取数据和创建图表。Giraph 使用在Giraph Configuration 对象中指定的 InputFormat 类来读取输入数据并在内存中创建一个图形。当超步完成时,它使用 OutputFormat 类将内存中的结果图转换为可写格式,并将其存储在作为配置对象中的输出路径指定的目录中。还有其他一些属性,可以修改它们来定制 Giraph 的执行行为,但如果没有指定,则由 Giraph 使用默认值。
下图显示了 Giraph 工作的最小组成。