1 Hama介绍
Apache Hama是一个纯BSP(Bulk Synchronous Parallel)计算框架,模仿了Google的Pregel。用来处理大规模的科学计算,特别是矩阵和图计算。
BSP概念由Valiant(2010图灵奖获得者)在1990年提出,具体参看wikipedia。Google在2009年发表了<Pregel: A System for Large-ScaleGraph Processing>论文,在分布式条件下实现了BSP模型。
2 Hama安装
安装Hama之前,应该首先确保系统中已经安装了hadoop。
第一步:下载并解压文件
hama的下载地址:http://mirror.bit.edu.cn/apache/hama/0.6.0/。
解压文件。
tar zxvf hama-0.6.0.tar.gz
第二步:修改配置文件
集群配置:
hadooptestnode2: BSPMasterRunner GroomServerRunner ZooKeeperRunner
hadooptestnode3: GroomServerRunner
进入$HAMA_HOME/conf文件夹。
修改hama-env.sh文件。加入JAVA_HOME变量。
修改groomservers文件。加入集群地址。
hadooptestnode2
hadooptestnode3
修改hama-site.xml文件。我的hama-site.xml配置文件如下:
<?xml version="1.0"?>