一,在我们配置完hadoop-env.sh, core-site.xml, hdfs-site.xml, mapred-site.xml文件后,启动集群关闭后,再次启动发现少了datanode进程。
这时候只需要将hadoop压缩包下面的tmp/dfs文件夹中的文件全部删除。
然后再次格式化HDFS中的namenode,再次格式化的时候会显示是否确定格式化,这时候尽量输入大写的Y,不要输入小写的y。Hadoop的新版本还存在一些小问题。尽量避免。
二、当启动伪分布全部进程后,六个进程都有,但无法通过web浏览器访问HDFS。
如果你是Hadoop3.x以上的版本,需要将端口号50070改成9870.
注意:不要输入https://localhost:9870,https和http多一个‘s’都可以让你访问不成功。
如果你想在主机访问,需要在主机配置映射才能进行访问。