主题思想: 总结下hadoop 相关的简易设置
hadoop 相关的配置文件,主要
core-default.xml
core-site.xml
hdfs-default.xml
hdfs-site.xml
yarn-site.xml
mapred-site.xml
其中default.xml 无法看到,,根据源码, 会先加载 core-default.xml 然后是core-site.xml, 在core-site 中配置的项会覆盖掉core-default 配置的项。
一个伪分布模式,需要是指, fs.defaultFS , dfs.name.dir dfs.data.dir,home.tmp.dir ,dfs.replication
这几个值,
一个core-site.xml 文件
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost/</value>
</property>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/zzy/hadoopdata/tmp</value>
</property>
<property>
<name>dfs.name.dir</name>
<value>/home/zzy/hadoopdata/filesystem/name</value>
</property>
<property>
<name>dfs.data.dir</name>
<value>/home/zzy/hadoopdata/filesystem/data</value>
</property>
</configuration>
要把xml中的文件夹先创建好。
然后启动的时候,hadoop namenode , hadoop datanode
把namenode datanode 启动起来就算是把hdfs 启动起来了。
$ hadoop namenode
$ hadoop datanode