大数据图形处理工具HAMA的安装及测试

最新推荐文章于 2021-04-26 18:09:17 发布

paradise_fch

最新推荐文章于 2021-04-26 18:09:17 发布

阅读量2.5k

点赞数

本文链接：https://blog.csdn.net/paradise_fch/article/details/14000187

版权

本文介绍了Apache HAMA的安装过程，它是一个基于BSP（Bulk Synchronous Parallel）模式的大数据处理工具，用于图形算法。在Hadoop HDFS上搭建HAMA集群，包括配置groomservers、hama-env.sh和hama-site.xml文件，并进行了简单的矩阵生成和PageRank算法测试。

摘要由CSDN通过智能技术生成

由于研究的需要，最近对HAMA做了简单的测试。和大家分享一下。

1.1什么是HAMA：

HAMA是apache的一个开源项目，作云计算的人都知道mapreduce，但mapreduce编程模式处理的是特定模式的海量数据，但对于需要反复迭代以及图形算法实现则显得不那么灵光。说道HAMA就不得不提BSP模式，这里我就不多说BSP模式，大家自己wiki吧。BSP模式可以实现并行化，HAMA和mapreduce一样，只是HAMA将BSP这种模式并行化了，mapreduce将那种统计计算并行化了。

1.2HAMA安装：

本博主要介绍HAMA的安装集测试就不多少原理了。

HAMA是架设在hadoop的HDFS之上，文件都存储在HDFS上。所以需要首先安装hadoop集群。Hadoop集群的安装和配置我也不多少了，网上很多安装说明。

我用3台机器架了个集群配置为：

dh1:namenode jobtracker

dh2:datanode tasktracker

dh3:datanode tasktracker

因为集群上有hbase，所以ZooKeeper也不用安装了。ZooKeeper包括dh1,dh2,dh3.

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

paradise_fch

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

最全面的大数据技术知识体系

Hadoop环境搭建教程

01-14

692

大数据技术知识体系 大数据技术知识体系 --持续更新，建议收藏最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡，麦肯锡称：“数据，已经渗透到当今每一个行业和业务职能领域，成为重要的生产因素。人们对于海量数据的挖掘和运用，预示着新一波生产率增长和消费者盈余浪潮的到来。”数据，让一切有迹可循，让一切有源可溯。我们每天都在产生数据，创造大数据和使用大数据，只是，你，仍然浑然不知。企业...

Hama 安装笔记

07-01

分布式模式的Hama安装笔记，内容如下： 1.参考“hadoop安装.txt”,完成hadoop的安装。节点信息如下： 192.168.1.160 hadoop-1 192.168.1.161 hadoop-2 192.168.1.162 hadoop-3 2.添加环境变量在/etc/profile 或者/home/用户/.bash_profile 下添加： export HAMA_HOME=/home/hadoop/hama-0.6.0 export PATH=$PATH:$HAMA_HOME/bin

参与评论您还未登录，请先登录后发表或查看评论

Apache Hama安装笔记

weixin_34413065的博客

12-16

259

Hama介绍 Apache Hama是一个纯BSP（Bulk Synchronous Parallel）计算框架，模仿了Google的Pregel。用来处理大规模的科学计算，特别是矩阵和图计算。 BSP概念由Valiant（2010图灵奖获得者）在1990年提出，具体参看wikipedia。Google在2009年发表了<Pregel: A System for Large-Scale ...

hama安装

spark的专栏

05-10

1511

1、前提： hama安装前，需要系统已经完成如下操作：（1）安装JDK1.6以上版本（2）安装Hadoop0.20.x版本（这里我使用的是Hadoop-0.20.2，实际上，Hama仅使用了HDFS）（3）安装Zookeeper-3.3.2（Hama自身携带Zookeeper，但是为了彻底了解hama机制，建议自己安装Zookeepe

hadoop集群下安装及配置hama

m0_56975146的博客

04-26

548

一、简介： hama是基于BSP(BulkSynchronous Parallel)计算技术的并行计算框架，用于大量的科学计算。二、Hama 的下载安装 1、下载网址： http://archive.apache.org/dist/hama/ 2、通过FlashFXP 文件传输助手连接虚拟机，将hama压缩文件上传到虚拟机的自定义目录下（例如我上传到home/hadoop/downloads/路径下） 3、在自定义目录下进行解压 #:cd ~ #:cd /home/hadoop/download

安装hadoop-hama

ZH519080的博客

06-18

1083

1、在vmware forlinux上安装Centos6.5 2、在centos上配置网络信息 3、 Centos创建用户“zhuhaichuan” 4、关闭防火墙 5、配置/etc/hosts文件 6、 Jdk安装 7、 ssh无密码登陆 8、 hadoop配置安装 9、 hama配置安装注意：我的jdk安装在root用户中，ssh、

大数据技术开发环境搭建.docx

04-15

此外，教程还涵盖了其他数据存储和处理工具，如MySQL（关系型数据库）、Hive（基于Hadoop的数据仓库工具）、Redis（内存数据结构存储）、MongoDB（文档型数据库）和Neo4j（图形数据库）。这些工具提供了不同类型的...

总结：关于大数据的99篇重量级论文及开发项目

evilqliang的博客

12-07

925

本文在Creative Commons许可证下发布下文提及到的100篇参考文献（这些文献中大多都是一些开创性的研究论文），将会为你提供结构性的深度剖析，绝非泛泛而谈。我相信，这可从根本上帮助你深度理解大数据体系组件间的细微差别。但如果你打算“走马观花”般地快速过一遍，了解大数据为何物，对不起，这里可能会让你失望。那么，准备好了吗？让我们走起！在介绍这100篇文献之前，首先...

您应该知道的101个大数据术语

大数据基础入门教程

03-21

2856

由于每天都会产生大量的数据，因此了解大数据的复杂性变得至关重要。如果您打算进入大数据星球，则应该熟悉大数据术语。这些术语将帮助您深入了解大数据世界。因此，让我们从术语大数据本身开始- 由于业务专业人员，项目，从业人员和供应商以不同的方式来理解“大数据”，因此很难准确定义。因此，一般而言，大数据是：大/大数据集（大数据集是指太大而无法在单台计算机上存储或处理的数据集），并且，用...

Hama-0.6.0

07-01

1.Hama-0.6.0，里面含有安装版和源码两部分，与hadoop-1.0.3 结合使用，已在Linux（RHEL和Ubuntu）平台测试通过。 2. Hama是基于HDFS上的BSP模型实现。

Apache Hama安装部署

weixin_30914981的博客

06-19

184

安装Hama之前，应该首先确保系统中已经安装了hadoop，本集群使用的版本为hadoop-2.3.0 一、下载及解压Hama文件　　下载地址：http://www.apache.org/dyn/closer.cgi/hama，选用的是目前最新版本：hama0.6.4。解压之后的存放位置自己设定。二、修改配置文件在hama-env.sh文件中加入JAVA_HOME变量（分布式情况...

Hama测试问题记录

cloudeagle_bupt的专栏

06-28

1238

使用DiskVerticesInfo类，

Hama安装

BYRans的专栏

08-15

2046

安装Hama 安装Hama之前，应该首先确保系统中已经安装了hadoop，本集群使用的版本为hadoop-2.3.0 一、下载及解压Hama文件，下载地址：http://www.apache.org/dyn/closer.cgi/hama，选用的是目前最新版本：hama0.6.4。解压之后的存放位置自己设定。二、修改配置文件 1. 在hama-env.sh文件中加入JAVA_HO

基于Hama平台的并行Finding a Maximal Independent Set 算法的设计与实现

Hama White 的博客

06-18

4246

本文目的：讲解并行Finding a Maximal Independent Set（寻找最大独立集问题）算法，以及在Hama平台上如何实现该算法。该算法可方便移植到所有的Pregel-Like系统中，如Giraph、GPS (Graph Processing System)。前言：关于Maximal Independent Set（MIS）的基础知识参考我的博客《找最大独立集问题-Finding a Maximal Independent Set》。 1. 本算法参考 Luby's classic pa

Hama框架学习（三） Master如何将job规划到GroomServer

hnhbwlp的专栏

08-11

853

*作者：王连平 *如有转载，请注明文章出处：[http://blog.csdn.net/wlp001007/article/details/47423533](http://blog.csdn.net/wlp001007/article/details/47423533%20%E6%96%87%E7%AB%A0%E5%9C%B0%E5%9D%80)本文章距离上一篇文章间隔了很长一段时间，很不好意思，

fortran简介

Technology DNA

10-29

1690

FORTRAN，亦译为福传，是英文“FORmula TRANslator”的缩写，译为“公式翻译器”，它是世界上最早出现的计算机高级程序设计语言，广泛应用于科学和工程计算领域。FORTRAN语言以其特有的功能在数值、科学和工程计算领域发挥着重要作用。特点：　　Fortran语言的最大特性是接近数学公式的自然描述，在计算机里具有很高的执行效率。　　易学，语法严谨。　　可以直接对矩阵和复数进行运算，这一点类似matlab。　　自诞生以来广泛地应用于数值计算领域，积累了大量高效而可靠的源

Hama学习总结

Hama White 的博客

06-18

4072

Hama学习笔记 1. Hama定义 Hama是基于HDFS上的BSP模型实现，其运行不需要MapReduce。例证如下: 在单点调试的Hama系统上，只运行NameNode、DataNode、BSPMasterRunner、GroomServerRunner和 ZooKeeperRunner进程，即可运行PageRank程序。 2. MapReduce与BSP区别执行机制：MapR

大数据分析你不能不懂的6个核心技术

weixin_34146986的博客

07-05

3762

目前，大数据领域每年都会涌现出大量新的技术，成为大数据获取、存储、处理分析或可视化的有效手段。大数据技术能够将大规模数据中隐藏的信息和知识挖掘出来，为人类社会经济活动提供依据，提高各个领域的运行效率，甚至整个社会经济的集约化程度。 1大数据生命周期图1展示了一个典型的大数据技术栈。底层是基础设施，涵盖计算资源、内存与存储和网络互联，具体表现为计算节...