守护进程:
hadoop的三大主要配置文件:
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property> <!--NameNode的结点的URI(协议、主机名、端口号)-->
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hdfs/tmp</value>
</property> <!--基础配置,如果hdfs_site.xml不配置namenode和datanode的存放位置,默认就在这个路径中-->
<property>
<name>dfs.replication</name>
<value>1</value>
</property> <!--文件块的数据备份个数(如果是完全分布式一般为3个,这里因为写的是伪分布式,所以是1)-->
<property>
<name>dfs.name.dir</name>
<value>/home/hdfs/name</value>
</property> <!--namenode的路径,value里要写你自己的路径位置-->
<property>
<name>dfs.data.dir</name>
<value>/home/hdfs/data</value>
</property> <!--datanode的路径,value里要写你自己的路径位置-->
<property>
<name>dfs.permissions</name>
<value>false</value>
</property> <!--false→hdfs关闭,true→hdfs开启-->
mapred_site.xml中:
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property> <!--jobtracker的主机(或IP)和端口-->
注:笔记内容纯属于个人理解,如有错误,欢迎指出。