伪分布式的hadoop配置

最新推荐文章于 2024-11-03 16:56:30 发布

Mr-稻帅

最新推荐文章于 2024-11-03 16:56:30 发布

阅读量120

点赞数

文章标签：大数据运维操作系统

关于hadoop的发展和历史以及简介，这样的废话就不说，简而言之就一句话，开源的分布式云计算。

目前鄙人使用的是hadoop-1.0.4，下载地址：http://mirrors.cnnic.cn/apache/hadoop/common/hadoop-1.0.4/ 下载 hadoop-1.0.4.tar.gz 即可。

解压即可。

先对伪分布式的概念进行说明一下，整个环境的配置是基于linux的，目前鄙人使用的是redhat6企业版。

可以把伪分布式的Hadoop看做只有一个节点的集群，在这个集群中，这个节点既是Master，也是Slave;既是NameNode，也是DataNode;既是JobTracker，也是TaskTracker。

安装和配置Hadoop伪分布式有两个必要的条件，一个是JDK的环境，一个是linux SSH环境。其中SSH环境，最好配置为免密码登陆。（笑话：此处的SSH不是java里面的SSH框架，如果你是这么认为，我只能跟你说一句话：你很farmer。）关于这两个环境的配置，这边就不一一讲解了，可以参照其他博文。

下面开始来配置Hadoop：

1、进入conf文件夹，修改Hadoop-evn.sh，指定JDK

export JAVA_HOME=/opt/jdk1.6.0_43

2、配置HDFS的（Hadoop分布式文件系统）的地址和端口号

conf/core-site.xml:

<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>

3、HDFS的默认备份方式是3，单机修改为1

conf/hdfs-site.xml

<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>

4、配置JobTracker的地址及端口，MapReduce的配置

conf/mapred-site.xml

<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>

接下来就是启动Hadoop，先格式化HDFS。进入Hadoop文件夹，输入命令：bin/Hadoop namenode -format

启动Hadoop的命令：bin/start-all.sh

如果此处你没有配置SSH免密码登陆，需要你输入多次的用户密码。

如果启动成功，你可以在浏览器下分别输入：

http://localhost:50030 为MapReduce的web页面

http://localhost:50070 为HDFS的web页面

如果都能查看，说明配置成功。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。