xml 文件配置后出错: 可能是xml的 头文件注释给不小心弄掉了
也可能是 property 没有 包含到 configuration 里面
xml 文件的配置 只是 会读 就好了, 不需要默写 背会, 到时候 粘上就 就可。
其实hdfs分布式并非只是配置了 所看见 configuration 里的东西,很多默认的东西,还是系统自带的有,只是对我们透明了。
为什么 replication 要设置成 1 ?
因为伪分布式的情况下,就是 一个单节点,设置多了,也不会把其他的副本给分发到其他的节点上,无非也就是浪费磁盘空间,因为当宕机的时候,这样的同一节点上的副本也是跟着一起坏的
hadoop 集群的启动是 会 调用 xml 配置文件的,所以配置文件的设置,也就决定了 hadoop集群的运行方式
伪分布式要配置 etc/hadoop/ 下的 hadoop-env.sh , core-site.xml, hdfs-site.xml
如果要切换回本地运行,则需要删除配置信息
dfs.namenode.name.dir 和 dfs.datanode.data.dir 设置到 hadoop的家目录中 就像 hadoop.tmp.dir 一样,这样最好。
如果 按照默认值,可能有的 default 路径在/tmp 下, /tmp 会在linux服务器重启的时候给 清空,导致用的时候得 format namenode才行
bin/hdfs namenode -format 格式化 namenode 重新加载元数据,一般情况下只在第一次 格式化,之后就不需要了