华为云耀云服务器L实例-大数据学习-hadoop 正式部署

技术僧sxs

于 2024-01-05 11:30:45 发布

阅读量1k

点赞数 20

文章标签：大数据华为云服务器

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaojinyuya/article/details/135405644

版权

华为云耀云服务器L实例-大数据学习-hadoop 正式部署

产品官网：云耀云服务器L实例 _【最新】_轻量云服务器_轻量服务器_轻量应用服务器-华为云

今天我们采用可靠更安全、智能不卡顿、价优随心用、上手更简单、管理特省心的华为云耀云服务器L实例为例，演示单台服务器模拟配置hadoop集群

Hadoop 是一个开源的分布式存储和计算框架，旨在处理大规模数据集。它是 Apache 软件基金会的一个顶级项目，为用户提供了一种可靠、可扩展且高效处理大数据的方式。

1. Hadoop Distributed File System（HDFS）： HDFS 是 Hadoop 的分布式文件系统，设计用于存储大规模数据集。它将数据划分为块（block）并分布存储在多台机器上，提供了高容错性和可靠性。

2. MapReduce： MapReduce 是 Hadoop 的计算模型，用于并行处理大规模数据集。它将计算任务分解为 Map 和 Reduce 阶段，通过在分布式环境中执行这些任务来实现数据处理。

3. YARN（Yet Another Resource Negotiator）： YARN 是 Hadoop 的资源管理器，负责集群资源的管理和调度。它允许多个应用程序共享同一集群，从而更有效地利用集群资源。

4. Hadoop生态系统： Hadoop 生态系统包含许多其他工具和框架，如 Hive、Pig、HBase、Spark 等，用于支持不同类型的数据处理和分析需求。

5. 扩展性： Hadoop 具有良好的可扩展性，可以轻松地在集群中添加新的节点以处理不断增长的数据量。它支持在普通硬件上搭建集群，使得大规模数据处理变得更加经济高效。

6. 开源和社区支持： Hadoop 是开源软件，由全球的开发者社区维护和支持。它拥有庞大的用户社群和活跃的开发者社区，不断推动框架的发展和改进。

Hadoop 被广泛应用于处理大规模数据，包括数据存储、数据分析、机器学习等各种场景。它的设计理念使得它适用于在常规硬件上搭建的大规模集群，并为用户提供了一种可靠、高效、可扩展的大数据处理解决方案。

### 步骤 1：安装包下载

官方网址： https://hadoop.apache.org ，使用 3.3.4 版。

### 步骤 2：上传与解压

使用finalshell工具将安装包上传至华为云耀云服务器L实例，执行以下命令进行解压：

```bash

tar -zxvf hadoop-3.3.4.tar.gz -C /export/server

cd /export/server

ln -s /export/server/hadoop-3.3.4 hadoop

cd hadoop

```

解压完成后的目录如图所示

### 步骤3 ：修改配置文件

配置workers文件

```bash

# 进入配置文件目录

cd etc/hadoop

# 编辑 workers 文件

vim workers

# 填入如下内容

node1

```

配置hadoop-env.sh文件

# 填入如下内容

```bash

export JAVA_HOME=/export/server/jdk

export HADOOP_HOME=/export/server/hadoop

export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

export HADOOP_LOG_DIR=$HADOOP_HOME/logs

```

配置 core-site.xml 文件

在文件内部填入如下内容：

```bash

<configuration>

<property>

<name>fs.defaultFS</name>

<value>hdfs://node1:8020</value>

</property>

<property>

<name>io.file.buffer.size</name>

<value>131072</value>

</property>

</configuration>

```

配置 hdfs-site.xml 文件

```bash

<configuration>

<property>

<name>dfs.datanode.data.dir.perm</name>

<value>700</value>

</property>

<property>

<name>dfs.namenode.name.dir</name>

<value>/data/nn</value>

</property>

<property>

<name>dfs.namenode.hosts</name>

<value>node1,node2,node3</value>

</property>

<property>

<name>dfs.blocksize</name>

<value>268435456</value>

</property>

<property>

<name>dfs.namenode.handler.count</name>

<value>100</value>

</property>

<property>

<name>dfs.datanode.data.dir</name>

<value>/data/dn</value>

</property>

</configuration>

```

准备数据目录

```bash

mkdir -p /data/nn

mkdir /data/dn

```

配置环境变量

（1）vim /etc/profile

```bash

# 在 /etc/profile 文件底部追加如下内容

export HADOOP_HOME=/export/server/hadoop

export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

```

授权为 hadoop 用户

至此，hadoop 部署的准备工作基本完成，为了确保安全， hadoop 系统不以 root 用户启动，我们以普通用户 hadoop 来启动整个 Hadoop ，现在对文件权限进行授权。

```bash

chown -R hadoop:hadoop /data

chown -R hadoop:hadoop /export

```

格式化并启动

（1）格式化 namenode

```bash

# 确保以 hadoop 用户执行

su - hadoop

# 格式化 namenode

hadoop namenode -format

```

（2）启动

```bash

# 一键启动 hdfs 集群

start-dfs.sh

# 一键关闭 hdfs 集群

stop-dfs.sh

# 如果遇到命令未找到的错误，表明环境变量未配置好，可以以绝对路径执行

/export/server/hadoop/sbin/start-dfs.sh

/export/server/hadoop/sbin/stop-dfs.sh

```

至此，华为云耀云服务器L实例上的hadoop服务已经部署完毕，且成功启动。接下来，我们将尝试入门的实践。

关注

20
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
华为云耀云服务器L实例-大数据学习-hadoop 正式部署

它的设计理念使得它适用于在常规硬件上搭建的大规模集群，并为用户提供了一种可靠、高效、可扩展的大数据处理解决方案。Hadoop 具有良好的可扩展性，可以轻松地在集群中添加新的节点以处理不断增长的数据量。hadoop 部署的准备工作基本完成，为了确保安全， hadoop 系统不以 root 用户启动，我们以普通用户 hadoop 来启动整个 Hadoop。Hadoop 生态系统包含许多其他工具和框架，如 Hive、Pig、HBase、Spark 等，用于支持不同类型的数据处理和分析需求。
复制链接

扫一扫

技术僧sxs CSDN认证博客专家 CSDN认证企业博客

码龄7年

152: 原创

28万+: 周排名

5万+: 总排名

7万+: 访问

: 等级

3103: 积分

1158: 粉丝

1573: 获赞

20: 评论

1611: 收藏

私信

关注

热门文章

最新评论

华为云耀云服务器L实例+使用本地navcat管理数据库
CSDN-Ada助手: 非常棒的博客！很高兴看到你分享了关于华为云耀云服务器L实例和使用本地Navicat管理数据库的经验。你的博文标题和摘要已经很清楚地介绍了使用Navicat进行数据导入和导出、直观的用户界面以及自动化任务和调度等功能。继续创作下去吧！对于与该博文相关的扩展知识和技能，我想提醒你一些关于数据库管理的常见概念，比如数据库备份和恢复、数据库性能优化以及数据库安全性等方面。这些知识和技能可以帮助你更好地管理和保护你的数据库，提高工作效率和数据安全性。再次感谢你的分享，期待看到更多精彩的博文！在持续学习和探索的过程中，我们都需要互相鼓励和学习。希望我的建议对你有所帮助。加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
华为云耀云服务器L实例+配置安全组
CSDN-Ada助手: 恭喜您写出了第三篇博客！标题“华为云耀云服务器L实例+配置安全组”听起来非常有趣和实用。我很高兴看到您在持续创作方面取得了进展。您在博客中分享的关于华为云耀云服务器和安全组配置的经验对读者来说一定非常有价值。作为下一步的创作建议，我建议您可以进一步探索和介绍华为云耀云服务器L实例和安全组配置的更多细节。您可以分享一些实际案例、最佳实践或者解决常见问题的技巧。此外，您也可以考虑探讨其他与云服务器相关的主题，如性能优化、成本控制或者多云架构等等。我相信您的深入研究和分享将为读者带来更多的收益。继续加油写作，期待您未来更多精彩的博客！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
华为云耀云服务器L实例+使用软件管理
CSDN-Ada助手: 非常高兴看到您发布的第四篇博客！恭喜您在标题中提到了华为云耀云服务器L实例和软件管理的内容。您的博客内容一定会对那些对云服务器和软件管理感兴趣的读者有很大帮助。希望您能继续保持创作的势头，分享更多有关华为云的实例和技巧。在下一篇博客中，或许您可以考虑加入一些实际案例或者操作步骤的详细说明，这样读者更容易理解和跟随您的教程。同时，您也可以考虑探讨一些相关的话题，比如如何优化云服务器性能、如何选择适合自己需求的软件管理工具等等。这些都是读者非常关注的问题，也会让您的博客更加丰富和有深度。再次祝贺您，期待您的下一篇博客！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
华为云耀云服务器L实例+mysql部署
CSDN-Ada助手: 恭喜你写了这么有用的一篇博客！看到你对华为云的服务器L实例和mysql部署有如此深入的了解，真是让人佩服。不过，我觉得你可以考虑在下一篇博客中分享一些关于服务器安全性的内容，或者介绍一些常见的mysql问题及解决方法，这样可以让读者对服务器和数据库管理有更全面的了解。期待你的下一篇作品！
华为云耀云服务器L实例+java环境配置
CSDN-Ada助手: 恭喜您写了第6篇博客！标题“华为云耀云服务器L实例+java环境配置”听起来非常有趣。我真的很喜欢您分享关于华为云服务器和Java环境配置的经验。您的博客对于那些想要深入了解这方面知识的读者将会非常有帮助。对于下一步的创作建议，我认为您可以考虑分享一些实际应用案例，例如如何在华为云耀云服务器上部署一个Java Web应用程序或者如何优化Java环境以提高性能等。这样的内容将进一步拓宽您博客的受众群体，并且使读者能够更加深入地了解如何利用这些知识来解决实际问题。再次恭喜您，期待您未来更多精彩的创作！

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。