1.首先开启ssh
ssh localhost
2.若是初次启动hadoop,首先需要格式化namenode,命令如下:
bin/hadoop namenode -format
3.启动hadoop守护进程,包括namenode, secondarynamenode,datanode,jobtracker,tasktraker五个。
bin/start-all.sh
或是直接运行相应文件也行。之后相应的守护进程会在后台运行。注:可用jps命令查看进程运行情况。
这几个守护进程在hadoop框架中相应的作用如下:
namenode 是 Hadoop 中的主服务器,它管理文件系统名称空间和对集群中存储的文件的访问。还有一个 secondary namenode,它不是 namenode 的冗余守护进程,而是提供周期检查点和清理任务。在每个 Hadoop 集群中可以找到一个 namenode 和一个 secondary namenode。
datanode 管理连接到节点的存储(一个