大数据集群搭建之Linux安装hadoop3

2401_84183545

于 2024-04-28 18:32:26 发布

阅读量932

点赞数 15

分类专栏：程序员文章标签：大数据 linux 运维

本文链接：https://blog.csdn.net/2401_84183545/article/details/138287394

版权

本文详细描述了如何在Hadoop和YARN环境中配置编辑/etc/profile文件，涉及HADOOP_HOME路径设置、磁盘空间检查、核心、HDFS、HadoopHA、YARN组件的配置参数，以及资源管理和日志管理。旨在提供一个系统化的配置指南，帮助用户理解和实践分布式系统配置。

摘要由CSDN通过智能技术生成

编辑 /etc/profile 文件

vim /etc/profile

添加以下内容

export HADOOP_HOME=/usr/local/hadoop/hadoop

export PATH= $P A T H :$ HADOOP_HOME/bin:$HADOOP_HOME/sbin

四、修改配置文件

1、检查磁盘空间

首先查看磁盘挂载空间，避免hadoop的数据放在挂载空间小的目录

df -h

磁盘一共800G，home目录占了741G，故以下配置目录都会以 /home开头

2、修改配置文件

worker

hadoop003

hadoop004

hadoop005

core-site.xml

<?xml version="1.0" encoding="UTF-8"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

fs.defaultFS

hdfs://ns1

hadoop.tmp.dir

/home/cluster/hadoop/data/tmp

io.file.buffer.size

131072

Size of read/write buffer used in SequenceFiles

ha.zookeeper.quorum

hadoop001:2181,hadoop002:2181,hadoop003

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

2401_84183545

关注关注

15
点赞
踩
27

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Linux大数据集群环境搭建步骤

我还起舞了的博客

04-09

1036

*Mac传送文件到虚拟机方法: 连接主机如下：传输文件： scp 文件位置及文件名 root@IP地址：需要存储文件的位置 1.配置NAT网络注意：将vm的网络适配器改成NAT模式编辑 /etc/sysconfig/network-scripts/ifcfg-ens33 文件修改为： BOOTPROTO=static ONBOOT=yes ( 以下配置为自己电脑的IP或网关之类) 在末尾加入： IPADDR=192.168.46.101 （最后10

Linux搭建Hadoop集群环境(三节点)

gm_ji的博客

08-14

355

搭建环境为三台安装CentOS 8 的虚拟机,包括安装部署Java环境,Hadoop环境,chrony时间同步工具等

1 条评论您还未登录，请先登录后发表或查看评论

大数据Linux集群搭建和配置

PioneerOneLi的博客

10-17

500

大数据中Linux集群搭建与配置测试需要，一共安装4台linux系统,在windows上用vm搭建。对应4个IP为192.168.0.110、111、112、113，这里记录其中一台的搭建过程，其余直接克隆虚拟机，修改相关配置即可。软件版本选择：虚拟机：VMware® Workstation 14 Pro版本：14.1.3 build-9474260 Linux：Cent...

Linux7安装Hadoop3集群（三台虚拟机）

ITwangxiaoxu的博客

09-16

1626

1.vim /etc/hostname修改主机名，重启后修改成功 2.添加域名映射 3.停用防火墙 4.设置三台虚拟机相互免密登录（先找到登录密钥，将密钥分别复制到3台虚拟机），三台虚拟机都要弄一遍 5.测试免密登录成功没有 6.查看jdk安装情况，（如果没有安装，现将jdk的rpm包传到相应文件夹运用rpm -ivh解压安装，javac查看安装成功没有 7.查看jdk安装路径（如...

Linux搭建大数据集群必备知识

zb313982521的博客

06-23

433

1.设置hostname: hostnamectl set-hostname xxx2.linux7安装CDH必备库yum install redhat-lsb yum install mod_sslyum install openssl-develyum install MySQL-pythonyum install python-psycopg23.关闭seLinux: vim /etc/s...

大数据技术基础实验报告-Linux环境下hadoop集群的搭建与基本配置.doc

08-21

【大数据技术基础实验报告-Linux环境下hadoop集群的搭建与基本配置】实验主要涉及了大数据技术中的基础概念，包括Linux操作系统、Java环境、SSH服务、Hadoop集群的搭建与配置。以下是具体步骤和知识点的详细解释：...

Hadoop大数据集群搭建（超详细）_hadoop集群搭建

最新发布

2401_84181070的博客

04-27

1127

打开C:\Windows\System32\drivers\etc下的hosts文件,添加以下内容（注：如果没有notepad++这类软件，可以通过记事本保存在其他位置，然后拖动到该文件夹下）同样通过mobaxterm的上的SFTP功能（或其他工具）上传到/export/software目录下，然后解压到/export/servers目录下。传完之后要在hadoop02和hadoop03上分别执行 source /etc/profile 命令，来刷新配置文件。在hadoop01上执行。

大数据hadoop分布式集群搭建（Hadoop、hbase、hive、mysql、zookeeper、Kafka、flume）

08-23

自己整理的Hadoop环境的一些安装，和一些简单的使用，其中包括Hadoop、hbase、hive、mysql、zookeeper、Kafka、flume。都是一些简单的安装步骤和使用，只在自己的虚拟机（Linux centOS7）上使用测试过。按照步骤一步...

Linux CentOS 7 搭建 Hadoop3 分布式集群

刘李404not_found的博客

04-25

1886

一、准备三台服务器需要安装JDK： https://blog.csdn.net/qq_39680564/article/details/82768938 需要配置免秘钥与修改主机名： https://blog.csdn.net/qq_39680564/article/details/89498678 需要安装zookeeper集群 https://blog.csdn.net/qq_3968056...

大数据学习笔记（yarn集群搭建）

smy12138的博客

10-19

191

yarn集群规划在原有的hadoop环境下修改配置文件： mapred-site.xml &lt;property&gt; &lt;name&gt;mapreduce.framework.name&lt;/name&gt; &lt;value&gt;yarn&lt;/value&gt; &lt;

大数据入门（14）hadoop+yarn+zookeeper集群搭建

m0_67391521的博客

08-28

415

2.2.6修改slaves(slaves是指定子节点的位置，因为要在weekend01上启动HDFS、在weekend03启动yarn，所以weekend01上的slaves文件指定的是datanode的位置，#格式化后会在根据core-site.xml中的hadoop.tmp.dir配置生成个文件，这里我配置的是/weekend/hadoop-2.4.1/tmp，#然后将/weekend/hadoop-2.4.1/tmp拷贝到weekend02的/weekend/hadoop-2.4.1/下。...

Linux中Hadoop的安装与配置

weixin_54354021的博客

11-27

4650

linux中hadoop的安装步骤

YARN HA 搭建以及自动故障转移测试

qq_43613793的博客

03-30

1083

yarn-site.xml文件配置 <configuration>  <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property>

Hadoop Yarn配置参数整理（非常全面）

学亮编程手记

07-21

901

yarn学习笔记

epitomizelu的专栏

06-24

612

一，重启机制（手动重启） 1，不保留工作的RM重启在Hadoop-2.4.0版本实现，当Client提交一个application给RM时，RM会将该application的相关信息存储起来，具体存储的位置是可以在配置文件中指定的，可以存储到本地文件系统上，也可以存储到HDFS或者是Zookeeper上，此外RM也会保存application的最终状态信息(failed，killed，finished),如果是在安全环境下运行，RM还会保存相关证书文件。当RM被关闭后，NodeManager(以下简称N

高可用集群搭建

weixin_44778060的博客

11-14

531

分布式环境搭建 1. 集群规划使用完全分布式，实现ResourceManager的高可用集群运行服务规划 2. 安装包解压停止之前的Hadoop集群的所有服务，然后重新解压编译后的Hadoop压缩包，解压压缩包 node1节点执行以下命令进行解压 mkdir -p /opt/software cd /opt/software/ tar -zxvf hadoop-2.7.5.tar.gz -C /export/server/ cd /export/servers/hadoop

YARN查看和切换ResourceManager的状态

王义凯的博客

09-07

9507

当YARN开启了HA之后，我们想要知道两个ResourceManager中哪台是ACTIVE，哪台是STANDBY状态，可以通过下面的方式来获取或切换它们的状态。

大数据集群环境搭建

rm -rf/坏习惯

01-29

2852

#linux集群环境搭建集群、分布式---->多台机器虚拟机克隆服务器基础环境准备 1、防火墙关闭 2、主机名hostname修改 3、hosts主机名 IP映射 4、ssh免密登录 5、扩展：跳板机、堡垒机 6、集群时间同步 7、scp 跨集群复制文件 #Linux软件安装 rpm包 yum安装软件 #软件安装 JDK # shell编程

大数据平台环境搭建