hadoop集群搭建--伪分布式

本文档详细介绍了如何在Windows 10环境下,通过VMware配置Linux虚拟机,搭建Hadoop伪分布式集群。涵盖了从配置网络、安装JDK和Hadoop、配置环境变量、配置SSH无密登录到初始化及启动守护线程的全过程。
摘要由CSDN通过智能技术生成

前情提要。我们搭建了单节点也就是本地hadoop集群。我直接以此为基础 扩展到伪分布式集群

目录

一、hadoop伪分布式

操作系统

软件要求 

三、配置详情

1.安装虚拟机和配置网络

2. 上传jdk和hadoop

   安装 VMware tools

    设置共享文件夹

 3. 安装jdk和hadoop

解压jdk和hadoop 

创建软链接

 4. 配置环境变量

配置hadoop配置文件

1.hadoop-env.sh

2.croe-site.xml

3.hdfs-site.xml 

 配置ssh无密登录

5.初始化以及启动守护线程

6.集群展示和小案例 

 



一、hadoop伪分布式

伪分布式集群(pseudo distributed cluster)是指在一台主机上模拟多个主机;hadoop的守护程序在本地计算机(虚拟机)上运行,模拟集群环境,并且是相互独立的Java进程。

在这种模式下,Hadoop使用的是分布式文件系统,各个作业也是由ResourceManager服务来管理的独立进程;与单节点模式相比,多了代码调试功能,允许检查内存使用情况,HDFS输入输出,以及其他的守护进程交互;类似于完全分布式模式下的集群。因此这种模式常用来开发测试Hadoop程序的执行是否正确。

操作系统

  • w10+vmware

软件要求 

三、配置详情

1.安装虚拟机和配置网络

实际上单节点是不需要配置网络的。因为要从w10上将jdk和hadoop安装包上传至虚拟机。并且我这台机器需要继续配置伪分布以及完全分布。所以我需要配置网络环境。配置网络其实很简单。不需要的朋友也可以试着配置一下。linux还是很有意思的

 我的虚拟机是由一个空白的安装了linux6.8桌面版复制而来。因此 我需要修改虚拟机的mac地址。如果你的虚拟机是创建而来,那么可以跳过修改mac地址的步骤。网络使用nat模式。

  1. sudo vim /etc/udev/rules.d/70-persistent-net.rules                   ----查看网卡信息以及记忆mac地址 
# This file was automatically generated by the /lib/udev/write_net_rules
# program, run by the persistent-net-generator.rules rules file.
#
# You can modify it, as long as you keep each rule on a single
# line, and change only the value of the NAME= key.

# PCI device 0x8086:0x100f (e1000)
#SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="00:0c:29:90:ab:e6", ATTR{type}=="1", KERNEL=="eth*", NAME="eth0"


----------将此处配置注释或删除 



# PCI device 0x8086:0x100f (e1000)
SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="00:0c:29:b2:e7:66", ATTR{type}=="1", KERNEL=="eth*", NAME="eth0"


----------记住网卡mac地址 即00:0c:29:b2:e7:66  并将网卡名改为 eth0  

2.sudo vim /etc/sysconfig/network-scripts/ifcfg-eth0              -----修改网卡配置文件

DEVICE=eth0
HWADDR=00:0C:29:B2:E7:66  ------将mac地址修改为刚才的mac地址
TYPE=Ethernet
UUID=c74cd800-bd98-4b84-9b67-821f3f8c14a1
ONBOOT=yes                -------将no改为yes 设置开机自动读取网络配置
NM_CONTROLLED=yes
BOOTPROTO=static          -------将dhcp改为static 设置为nat模式
IPADDR=192.168.61.70      -------添加ipaddr ip为vm8网卡同网段 查看方式vmware 编辑-虚拟网络编辑    
                                 器-vm8网卡-nat设置。 或者直接在window下ipconfig 查看vm8的ip
NETMASK=255.255.255.0     ------- 添加netmask 子网掩码 默认为255.255.255.0   
GATEWAY=192.168.61.2      -------添加gateway 默认网关 值为ip最后一位改为2
DNS1=192.168.61.2         -------添加 dns1  默认值何网关相同

3.修改主机名 和域名映射(因为我之后要搭建一个三个节点的完全分布集群 所以我的映射里面添加了三个从节点的ip) 

        sudo vim /etc/sysconfig/network       -------修改主机名

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值