大数据环境搭建攻略

最新推荐文章于 2023-04-21 18:14:53 发布

JasonAndChen

最新推荐文章于 2023-04-21 18:14:53 发布

阅读量790

点赞数

分类专栏： Hadoop 文章标签：大数据环境搭建

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/asdrt12589wto1/article/details/103329870

版权

Hadoop 专栏收录该内容

13 篇文章 0 订阅

订阅专栏

ip ddr / ipconfig 查看IP地址

大数据环境安装部署步骤

https://www.cnblogs.com/Jims2016/p/6985591.html

设置CentOS 主机名

hostnamectl set-hostname 主机名

hostname 查看设置是否成功

1、搭建环境步骤:

1)安装VMWare,然后安装CentOS，并修改linux ip地址

配置LinuxIP地址，然后关闭防火墙

systemctl stop firewalld.service 停止

systemctl disable firewalld.service 永久关闭

systemctl status firewalld.service 查看状态

然后ping www.baidu.com 或ip 地址

vi etc/sysconfig/network-scripts/ifcfg-enp0s3

vi /etc/hosts 修改主机名称与IP对应

配置/etc/resolv文件,添加nameserver为网关地址

/etc/resolv

nameserver 192.168.231.2

vi /etc/resolv.conf 修改域名解析 dns1、 dns2

vi /etc/sysconfig/network 修改主机名HOSTNAME

或修改主机名：hostnamectl set-hostname bigdata123

https://blog.csdn.net/ytangdigl/article/details/79776676

https://blog.csdn.net/saishuiye/article/details/80737540

2)安装WinSCP

3)安装JDK

4)在vi ~/.bash_profile 里面配置环境变量

JDK 环境变量配置

export JAVA_HOME=/opt/module/jdk1.8.0

export PATH=$JAVA_HOME/bin:PATH

hadoop 环境变量配置（bin/sbin 里面有执行命令）

HADOOP_HOME=/opt/module/hadoop-2.7.3

export HADOOP_HOME

PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

export PATH

5)source ~/.bash_profile 让其生效

分布式环境配置：

1、本地分布式配置

hadoop-env.sh 配置

export JAVA_HOME=/opt/module/jdk1.8.0

2、本地安装伪分布式配置副本为1

hadoop-env.sh 配置

export JAVA_HOME=/opt/module/jdk1.8.0

格式化nameNode bin/hdfs namenode -format

启动 sbin/start-dfs.sh

查看用jps

页面 ip地址:50070

3、完全分布式配置副本为3

Hadoop（HDFS+Yarn）本地伪分布全分布

2、Hadoop安装---本地安装

（1）特点：没有HDFS和Yarn 只能够测试MR程序是否成功，作为一个普通的java程序。

（2）修改文件：

vi hadoop-env.sh

set number

修改25行（行数不一 hadoop版本不一致）

JAVA_HOME=/opt/moudle/jdk1.8.0_181

cd /root/

mkdir temp

touch a.txt

vi a.txt

## mapred-site.xml 默认没有，我克隆的文件里面有这个文件没有被覆盖指定了yarn资源 ##

3、Hadoop安装---本地安装伪分布模式

（1）特点：在一台机器上模拟一个分布式环境具备hadoop的所有功能。

HDFS：NameNode+DataNode+SecondarynameNode

Yarn：ResourceManager+NodeManager

（2）修改的文件：

**step1:hadoop-env.sh**

JAVA_HOME=/opt/moudle/jdk1.8.0_181

** step2:hdfs-site.xml**

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

<!--

<property>

<name>dfs.permissions</name>

<value>false</value>

</property>

-->

**step3:core-site.xml**

<property>

<name>fs.defaultFS</name>

<value>hdfs://bigdata124:9000</value>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>/opt/moudle/hadoop-2.7.3/tmp</value>

</property>

**step4：mapred-site.xml(默认没有)**

cp mapred-site.xml.template mapred-site.xml

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

**step5：yarn-site.xml**

<property>

<name>yarn.resourcemanager.hostname</name>

<value>bigdata124</value>

</property>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

** step 6：通过HDFS namenode 格式化**

在第4步中，hadoop.tmp.dir--格式化

命令：hdfs namenode -format

验证：是否格式化成功：

Storage directory /opt/moudle/hadoop-2.7.3/tmp/dfs/name has been successfully formatted.

** 最后启动，通过start-all.sh启动**

最后用jps 验证是否伪分布式配置成功

验证： 5314 SecondaryNameNode

5586 NodeManager

5476 ResourceManager

5126 DataNode

5878 Jps

5022 NameNode

web 访问:

bigdata121:50070 HDFS

bigdata121:8088 YARN

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
大数据环境搭建攻略

ip ddr / ipconfig 查看IP地址大数据环境安装部署步骤https://www.cnblogs.com/Jims2016/p/6985591.html设置CentOS 主机名hostnamectl set-hostname 主机名hostname 查看设置是否成功1、搭建环境步骤:1)安装VMWare,然后安装CentOS，并修改linu...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。