Hadoop安装教程 Linux版

Hadoop安装教程 Linux版

一、Linux虚拟机安装

方法一:使用Windows下Linux子系统(大佬可选)
方法二:使用VMware安装Linux虚拟机(小白可选)
方法三:安装双系统(不怕麻烦的可以试试)

Note:安装虚拟机时选定你想要安装的Linux系统映像文件,该教程采用Ubuntu20.04版本。

a. 在VMware中新建虚拟机,选择程序光盘映像文件
VMware
b. 输入你的Linux名称,用户名和密码
Install
c. 根据向导提示完成安装
Note:安装时,虚拟机会自动下载文件,这一过程可以跳过以加速安装。

d. 启动虚拟机
Ubuntu

二、JDK环境安装

1. 下载JDK1.8

方法一:apt-get install openjdk-8-jdk
方法二:Oracle官网下载JDK1.8版本
方法三:百度网盘下载(链接: https://pan.baidu.com/s/19JoUU_GTxBlqpEvaB51nyA 提取码: 74vc)

Note:将文件下载到桌面上,以便操作

2. 配置JDK环境变量

将JDK文件解压并移动到 /usr/local/java 文件夹下

cd ~/Desktop
tar -zxvf jdk-8u281-linux-x64.tar.gz
sudo mv jdk1.8.0_281/ /usr/local/java

在terminal中输入 sudo vi /etc/profile ,按 i 进入编辑模式:

JAVA_HOME=/usr/local/java
export PATH=$PATH:$JAVA_HOME/bin
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

esc 退出编辑,输入 :wq 保存并退出。
在terminal中输入 source /etc/profile ,使配置的环境变量生效。

Linux下vi中使用方向键乱码解决办法

在Linux下,初始使用Vi的时候有两个典型的问题:

  1. 在编辑模式下使用方向键的时候,并不会使光标移动,而是在命令行中出现A、B、C、D四个字母;
  2. 当编辑出现错误,想要删除时,发现Backspace键不起作用,只能用Delete键来删除。

解决方法:

  1. 打开终端,输入命令 sudo gedit /etc/vim/vimrc.tiny ,进入vimrc.tiny文件的编辑状态
  2. 修改倒数第二行set compatible,将其改为set nocompatible;在set nocompatible下面添加一行:set backspace=2
  3. 保存,退出编辑。再使用vi时,已经可以正常使用方向键和Backspace。
    vimrc

二、Hadoop安装

1. 设置ssh免密码登录

因为Hadoop是分布式平台,需要多个机器之间协作,设置ssh免密码登录可以减少每次登陆主机输入密码的繁琐流程。

1) 安装SSH

Ubuntu 默认已安装了 SSH client,此外还需要安装 SSH server。
sudo apt-get install openssh-server

2) 设置免密登录

生成密钥对 ssh-keygen -t rsa ,回车到底
将公钥的内容写入到authorized_keys文件中 cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

3) 免密登录

ssh localhost
若能免密登录,即设置成功。

2. Hadoop下载与配置

1) 下载Hadoop

方法一:Hadoop官网下载
方法二:百度网盘下载(链接: https://pan.baidu.com/s/19JoUU_GTxBlqpEvaB51nyA 提取码: 74vc)

2) 配置Hadoop环境变量

将Hadoop文件解压并移动到 /usr/local/hadoop 文件夹下

cd ~/Desktop
tar -zxvf hadoop-3.2.2.tar.gz
sudo mv hadoop-3.2.2 /usr/local/hadoop

在terminal中输入 sudo vi /etc/profile ,按 i 进入编辑模式:

HADOOP_HOME=/usr/local/hadoop
export PATH=
  • 32
    点赞
  • 114
    收藏
    觉得还不错? 一键收藏
  • 7
    评论
实际上,Hadoop的安装过程与操作系统的类型无关,因此我将为您提供一个基于Linux系统的Hadoop安装教程。请注意,以下教程仅供参考,您可以根据您的具体环境和需求进行修改。 1. 安装Java开发工具包(JDK): - 在终端中运行以下命令以安装OpenJDK: ``` sudo apt-get update sudo apt-get install openjdk-8-jdk ``` 2. 配置Java环境变量: - 打开“~/.bashrc”文件: ``` nano ~/.bashrc ``` - 在文件末尾添加以下行: ``` export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64 export PATH=$PATH:$JAVA_HOME/bin ``` - 保存并关闭文件,然后运行以下命令以使配置生效: ``` source ~/.bashrc ``` 3. 下载和解压Hadoop软件包: - 访问Hadoop官方网站(http://hadoop.apache.org)并下载适用于Linux的最新稳定本。 - 打开终端并导航至下载目录。 - 使用以下命令解压下载的文件: ``` tar -xzvf hadoop-<version>.tar.gz ``` 4. 配置Hadoop环境变量: - 打开“~/.bashrc”文件: ``` nano ~/.bashrc ``` - 在文件末尾添加以下行: ``` export HADOOP_HOME=/path/to/hadoop-<version> export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin ``` - 保存并关闭文件,然后运行以下命令以使配置生效: ``` source ~/.bashrc ``` 5. 配置Hadoop集群: - 导航至Hadoop的配置目录: ``` cd $HADOOP_HOME/etc/hadoop ``` - 编辑“hadoop-env.sh”文件: ``` nano hadoop-env.sh ``` - 设置JAVA_HOME环境变量为Java安装路径: ``` export JAVA_HOME=/usr/lib/jvm/java-8-openjdk-amd64 ``` - 保存并关闭文件。 - 编辑“core-site.xml”文件: ``` nano core-site.xml ``` - 添加以下配置内容: ```xml <configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> </configuration> ``` - 保存并关闭文件。 - 编辑“hdfs-site.xml”文件: ``` nano hdfs-site.xml ``` - 添加以下配置内容: ```xml <configuration> <property> <name>dfs.replication</name> <value>1</value> </property> </configuration> ``` - 保存并关闭文件。 - 编辑“mapred-site.xml.template”文件: ``` nano mapred-site.xml.template ``` - 添加以下配置内容: ```xml <configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration> ``` - 保存并关闭文件。 - 重命名“mapred-site.xml.template”为“mapred-site.xml”: ``` mv mapred-site.xml.template mapred-site.xml ``` - 编辑“yarn-site.xml”文件: ``` nano yarn-site.xml ``` - 添加以下配置内容: ```xml <configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <property> <name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name> <value>org.apache.hadoop.mapred.ShuffleHandler</value> </property> </configuration> ``` - 保存并关闭文件。 6. 格式化Hadoop文件系统: - 在终端中运行以下命令以格式化HDFS: ``` hdfs namenode -format ``` 7. 启动Hadoop集群: - 在终端中运行以下命令以启动HDFS和YARN: ``` start-dfs.sh start-yarn.sh ``` 8. 检查Hadoop集群状态: - 在终端中运行以下命令以确保Hadoop集群正常运行: ``` jps ``` - 输出应包含NameNode、DataNode、ResourceManager和NodeManager等进程。 恭喜!您已经成功安装和配置了Hadoop。现在您可以开始使用Hadoop进行大数据处理和分析了。请记得根据您的具体需求进行进一步配置和调优。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值