前期进行Hadoop和VMware的基础知识复习方便后期项目进行。安装并配置了必要的软件环境,如VMware Workstation、CentOS操作系统、Hadoop、Hive等。
我们深入了解了Hadoop的基础知识,包括其分布式存储系统HDFS和计算框架MapReduce。接触了VMware虚拟化技术,为后续的实训环境搭建打下基础。我对接下来的实训充满期待,希望能够掌握这些技术,并在项目中应用它们。
1.VMware
之后按照教程操作完成虚拟机搭建。
最终结果
Hadoop主要的配置文件
hadoop-env.sh
- 文件中设置的是Hadoop运行时需要的环境变量。JAVA_HOME是必须设置的,即使我们当前的系统中设置了JAVA_HOME,它也是不认识的,因为Hadoop即使是在本机上执行,它也是把当前的执行环境当成远程服务器。
core-site.xml
<property>
<name>fs.defaultFS</name>
<value>hdfs://node-1:9000</value>
</property>
hdfs-site.xml
<property>
<name>dfs.replication</name>
<value>2</value>
</property>
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>node-2:50090</value>
</property>
mapred-site.xml
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
yarn-site.xml
<property>
<name>yarn.resourcemanager.hostname</name>
<value>node-1</value>
</property>