在搭建伪分布前,需要做好准备工作—安装并配置好jkd和hadoop。如果你没有完成准备工作,请将准备工作完成,再继续下面的文件配置。
准备工作入口处:
hadoop集群搭建的准备工作
- 伪分布模式修改3个配置文件
(1)配置:hadoop-env.sh(/home/hyn/software/hadoop/etc/hadoop)
Linux系统中获取jdk的安装路径。
(2)配置:core-site.xml(需要在hadoop文件夹下创建data文件夹,data文件夹下创建tmp文件夹)
指定HDFS中NameNode的地址
指定hadoop运行时产生文件的存储目录
<!-- 指定HDFS中NameNode的地址 -->
<property>
<name>fs.defaultFS</name>
<value>hdfs://Cloud:9000</value>
</property>
<!-- 指定hadoop运行时产生文件的存储目录 -->
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hyn/software/hadoop/data/tmp</value>
</property>
(3)配置:hdfs-site.xml
指定HDFS副本的数量(伪分布1个,完全分布3个)
<!-- 指定HDFS副本的数量 -->
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
- 启动hadoop集群,一台伪分布的机器就搭建好了
(1)格式化namenode(第一次启动时格式化,在bin/下)
bin/hdfs namenode -format
(2)启动namenode在sbin/下,启动后用jps查看
sbin/hadoop-daemon.sh start namenode
(3)启动datanode在sbin/下,启动后用jps查看
sbin/hadoop-daemon.sh start datanode
- 查看集群 jps,启动成功可以查看hadoop的webUI界面
可以根据自己虚拟机的ip地址,修改访问地址
如果在搭建集群遇到问题,可以参考以下文章寻求解决办法
搭建集群常见问题及解决办法