Day1 虚拟机中 Hadoop 的安装与配置

最新推荐文章于 2024-08-21 10:33:55 发布

→_→735

最新推荐文章于 2024-08-21 10:33:55 发布

阅读量269

点赞数 5

文章标签： hadoop 大数据分布式

本文链接：https://blog.csdn.net/qq_64373794/article/details/139823202

版权

Hadoop
是一个开源的分布式计算平台，它允许使用简单的编程模型在跨机器集群的环境中分布式处理大规模数据集。本博客将指导你如何在虚拟机环境中安装和配置
Hadoop，让你能够开始使用这个强大的大数据处理工具。

在开始之前，请确保你已经安装了以下软件：

Hadoop 需要 Java 环境来运行，因此需要先安装 Java：

sudo apt update
sudo apt install default-jdk

访问 Apache Hadoop 官网下载 Hadoop 的最新版本，或者使用以下命令下载：

wget https://downloads.apache.org/hadoop/common/hadoop-X.X.X/hadoop-X.X.X.tar.gz

tar -xzf hadoop-X.X.X.tar.gz

sudo mv hadoop-X.X.X /usr/local/hadoop

export HADOOP_HOME=/usr/local/hadoop
export PATH=$PATH:$HADOOP_HOME/bin

source ~/.bashrc

cd /usr/local/hadoop
cp core-site.xml.template core-site.xml
cp hdfs-site.xml.template hdfs-site.xml

在启动 Hadoop 之前，需要格式化 HDFS 文件系统：

hdfs namenode -format

启动 Hadoop 的所有服务：

start-dfs.sh
start-yarn.sh

使用 jps 命令检查 Hadoop 相关进程是否启动：

jps

你应该能看到 NameNode、DataNode、ResourceManager、NodeManager 等进程。

如果你希望在虚拟机中以伪分布式模式运行 Hadoop，需要在配置文件中做一些修改：

关注