hadoop集群搭建--1

最新推荐文章于 2023-03-04 14:33:04 发布

younglibin

最新推荐文章于 2023-03-04 14:33:04 发布

阅读量94

点赞数

分类专栏： hadoop 文章标签：大数据 java 运维

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/younglibin/article/details/88348561

版权

hadoop 专栏收录该内容

23 篇文章 0 订阅

订阅专栏

本系列博文我也不知道能不能写完，今天刚刚在新公司申请了4台机器，明天到位，准备打架hadoop环境，也准备在这里做下笔记，因为之前搭建hadoop环境遇到很多问题，没有详细记录，今天就在这里记录下。

hadoop 机器分布：

安装操作系统：

centos6.4，为什么选择centos6.4 因为之前做存储的时候，使用很多新的类库，再低版本没有，所以选择新一点的，防止出现其他问题，耽搁时间。

机器环境：

192.168.236.201 centos6.2

192.168.236.203 centos6.2

192.168.232.202 centos6.2

机器不在一个网段也不知道会出不会出现什么问题。

1.创建自己的用户：

[root@Hregion2 ~]# useradd libinhadoop

[root@Hregion2 ~]# passwd libinhadoop

用户名： libinhadoop 密码：123456

给用户添加sudo权限

sudo vi /etc/sudoers
libinhadoop ALL=(ALL) ALL

给用户添加免输入密码权限：

写道

libinhadoop ALL=(ALL) NOPASSWD: ALL

拷贝jdk 到集群机器上

配置环境变量：

写道

12 JAVA_HOME=/home/libinhadoop/software/jdk1.6.0_27
13 JRE_HOME=$JAVA_HOME/jre
14
15 PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin

配置这几台机器之间的ssh连接：

参考：

http://younglibin.iteye.com/admin/blogs/1913492

配置hadoop 按照 hadoop 官网找到自己的hadoop版本：

写道

http://archive.cloudera.com/cdh4/cdh/4/hadoop-2.0.0-cdh4.6.0/hadoop-project-dist/hadoop-common/SingleCluster.html

为了以后增加其他组件防止出现不匹配的信息，所以我是用了：

写道

hadoop-2.0.0-cdh4.6.0，配置文件目录 /home/libinhadoop/hadoop-2.0.0-cdh4.6.0/etc/hadoop

启动使用：/home/libinhadoop/hadoop-2.0.0-cdh4.6.0/bin/yarn

配置 mapreduce.shuffle的时候，注意这个配置不同版本有的是mapreduce_shuffle

执行测试测试配置hadoop是否正确：

写道

./bin/yarn jar ./share/hadoop/mapreduce2/hadoop-mapreduce-examples-2.0.0-cdh4.6.0.jar wordcount test/wordcount/testwordcount test/wordcount/testwordcount001

查看执行结果：

写道

./bin/hadoop cat test/wordcount/testwordcount001/part-r-00000

关于wordcount 的原理介绍，以及代码分析，查看本博客的其他关于hadoop的文章！

写道

$ cd $HADOOP_MAPRED_HOME
$ ./bin/yarn/ resourcemanager
$ ./bin/yarn/ nodemanager

[libinhadoop@Hregion2 hadoop-2.0.0-cdh4.6.0]$ jps
24428 NodeManager
23609 ResourceManager
24525 Jps

接下来，需要搭建hadoop集群环境了：

下班明天写..........

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hadoop集群搭建--1

境遇到很多问题，没有详细记录，今天就在这里记录下。 hadoop 机器分布：安装操作系统：centos6.4，为什么选择centos6.4 因为之前做存储的时候，使用很多新的类库，再低版本没有，所以选择新一点的，防止出现其他问题，耽搁时间。机器环境：192.168.236.201 centos6.2 192.168.236.203 centos6.2192.168.232.202 centos6.2 机器不在一个网段也不知道会出
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。