Linux 安装 Hadoop 教程

去官网下载Hadoop压缩包

Apache Hadoop

 

 

用XFTP把下载的压缩包放在opt目录下的install文件夹里

开始解压解压到opt目录下的soft

 改名为hadoop313

 改权限

 配环境变量

重新加载下

 在hadoop313目录下新建data目录

配置 vim ./core-site.xml

<configuration>
  <property>
    <name>fs.defaultFS</name>
    <value>hdfs://kb129:9000</value>
  </property>
  <property>
    <name>hadoop.tmp.dir</name>
    <value>/opt/soft/hadoop313/data</value>
  </property>
  <property>
    <name>hadoop.http.staticuser.user</name>
    <value>root</value>
  </property>
  <property>
    <name>io.file.buffer.size</name>
    <value>131073</value>
  </property>
  <property>
    <name>hadoop.proxyuser.root.hosts</name>
    <value>*</value>
  </property>
  <property>
    <name>hadoop.proxyuser.root.groups</name>
    <value>*</value>
  </property>
</configuration>

 配置 vim ./hadoop-env.sh  这里的路径是JDK的路径,可以参考我配JDK的博客

配置JDK

 配置  vim ./hdfs-site.xml

<configuration>
  <property>
    <name>dfs.replication</name>
    <value>1</value>
  </property>
  <property>
    <name>dfs.namenode.name.dir</name>
    <value>/opt/soft/hadoop313/data/dfs/name</value>
  </property>
  <property>
    <name>dfs.datanode.data.dir</name>
    <value>/opt/soft/hadoop313/data/dfs/data</value>
  </property>
  <property>
    <name>dfs.permissions.enabled</name>
    <value>false</value>
  </property>
</configuration>

 配置 vim ./mapred-site.xml 

<configuration>
  <property>
    <name>mapreduce.framework.name</name>
    <value>yarn</value>
  </property>
  <property>
    <name>mapreduce.jobhistory.address</name>
    <value>kb129:10020</value>
  </property>
  <property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>kb129:19888</value>
  </property>
  <property>
    <name>mapreduce.map.memory.mb</name>
    <value>4096</value>
  </property>
  <property>
    <name>mapreduce.reduce.memory.mb</name>
    <value>4096</value>
  </property>
  <property>
    <name>mapreduce.application.classpath</name>
    <value>/opt/soft/hadoop313/etc/hadoop:/opt/soft/hadoop313/share/hadoop/common/lib/*:/opt/soft/hadoop313/share/hadoop/common/*:/opt/soft/hadoop313/share/hadoop/hdfs/*:/opt/soft/hadoop313/share/hadoop/hdfs/lib/*:/opt/soft/hadoop313/share/hadoop/mapreduce/*:/opt/soft/hadoop313/share/hadoop/mapreduce/lib/*:/opt/soft/hadoop313/share/hadoop/yarn/*:/opt/soft/hadoop313/share/hadoop/yarn/lib/*</value>
  </property>
</configuration>

配置 vim ./yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->
  <property>
    <name>yarn.resourcemanager.connect.retry-interval.ms</name>
    <value>20000</value>
  </property>
  <property>
    <name>yarn.resourcemanager.scheduler.class</name>  
    <value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.fair.FairScheduler</value>
  </property>
  <property>
    <name>yarn.nodemanager.localizer.address</name>
    <value>kb129:8040</value>
  </property>
  <property>
    <name>yarn.nodemanager.address</name>
    <value>kb129:8050</value>
  </property>
  <property>
    <name>yarn.nodemanager.webapp.address</name>
    <value>kb129:8042</value>
  </property>
  <property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
  </property>
  <property>
    <name>yarn.nodemanager.local-dirs</name>
    <value>/opt/soft/hadoop313/yarndata/yarn</value>
  </property>
  <property>
    <name>yarn.nodemanager.log-dirs</name>
    <value>/opt/soft/hadoop313/yarndata/log</value>
  </property>
  <property>
    <name>yarn.nodemanager.vmem-check-enabled</name>
    <value>false</value>
  </property>
</configuration>

修改 vim ./workers

 

 

进入bin路径

 初始化(在bin路径下进行)

 出现successfully就成功了(到这一步就基本完成了)

 免密登录(这一步和Hadoop没关系,不配也行)

需要配两台虚拟机的ip地址,后面跟机器名,不然后面ssh -p 22 root@kb128会报错

 

 复制kb129的免密登录给kb128,然后就可以免密登录了

 下面就是hadoop的开启和关闭

 开启后去浏览器输入 192.168.198.129:9870 会跳转到网页,就说明成功了

记得关闭

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
实际上,Hadoop安装过程与操作系统的类型无关,因此我将为您提供一个基于Linux系统的Hadoop安装教程。请注意,以下教程仅供参考,您可以根据您的具体环境和需求进行修改。 1. 安装Java开发工具包(JDK): - 在终端中运行以下命令以安装OpenJDK: ``` sudo apt-get update sudo apt-get install openjdk-8-jdk ``` 2. 配置Java环境变量: - 打开“~/.bashrc”文件: ``` nano ~/.bashrc ``` - 在文件末尾添加以下行: ``` export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64 export PATH=$PATH:$JAVA_HOME/bin ``` - 保存并关闭文件,然后运行以下命令以使配置生效: ``` source ~/.bashrc ``` 3. 下载和解压Hadoop软件包: - 访问Hadoop官方网站(http://hadoop.apache.org)并下载适用于Linux的最新稳定版本。 - 打开终端并导航至下载目录。 - 使用以下命令解压下载的文件: ``` tar -xzvf hadoop-<version>.tar.gz ``` 4. 配置Hadoop环境变量: - 打开“~/.bashrc”文件: ``` nano ~/.bashrc ``` - 在文件末尾添加以下行: ``` export HADOOP_HOME=/path/to/hadoop-<version> export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin ``` - 保存并关闭文件,然后运行以下命令以使配置生效: ``` source ~/.bashrc ``` 5. 配置Hadoop集群: - 导航至Hadoop的配置目录: ``` cd $HADOOP_HOME/etc/hadoop ``` - 编辑“hadoop-env.sh”文件: ``` nano hadoop-env.sh ``` - 设置JAVA_HOME环境变量为Java安装路径: ``` export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64 ``` - 保存并关闭文件。 - 编辑“core-site.xml”文件: ``` nano core-site.xml ``` - 添加以下配置内容: ```xml <configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> </configuration> ``` - 保存并关闭文件。 - 编辑“hdfs-site.xml”文件: ``` nano hdfs-site.xml ``` - 添加以下配置内容: ```xml <configuration> <property> <name>dfs.replication</name> <value>1</value> </property> </configuration> ``` - 保存并关闭文件。 - 编辑“mapred-site.xml.template”文件: ``` nano mapred-site.xml.template ``` - 添加以下配置内容: ```xml <configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration> ``` - 保存并关闭文件。 - 重命名“mapred-site.xml.template”为“mapred-site.xml”: ``` mv mapred-site.xml.template mapred-site.xml ``` - 编辑“yarn-site.xml”文件: ``` nano yarn-site.xml ``` - 添加以下配置内容: ```xml <configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <property> <name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name> <value>org.apache.hadoop.mapred.ShuffleHandler</value> </property> </configuration> ``` - 保存并关闭文件。 6. 格式化Hadoop文件系统: - 在终端中运行以下命令以格式化HDFS: ``` hdfs namenode -format ``` 7. 启动Hadoop集群: - 在终端中运行以下命令以启动HDFS和YARN: ``` start-dfs.sh start-yarn.sh ``` 8. 检查Hadoop集群状态: - 在终端中运行以下命令以确保Hadoop集群正常运行: ``` jps ``` - 输出应包含NameNode、DataNode、ResourceManager和NodeManager等进程。 恭喜!您已经成功安装和配置了Hadoop。现在您可以开始使用Hadoop进行大数据处理和分析了。请记得根据您的具体需求进行进一步配置和调优。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值