安装部署Hadoop集群

安装Linux 系统  ( 参考网址  https://www.osyunwei.com/archives/7829.html )
        ps : 安装时,选择的语言选择英文
使用Linux镜像文件  CentOS-7-x86_64-DVD-1611.iso
        ps :  CentOS-7 默认的时图形界面 , 用不习惯的可以切换成指令界面 ( 参考网址 https://www.cnblogs.com/vaelailai/p/8037374.html )
  • centos7默认安装后, 跟其他版本一样,启动默认进入图形界面
  • 在图形化桌面,右击鼠标,选择[在终端中打开] , 以 root用户进入 , 即centos的命令行模式
  • 在终端命令行中输入 vi /etc/inittab , 查看系统的2种启动模式
  • 退出( 冒号 : q! )vi模式后 , 输入命令 systemctl get-default 查看当前系统启动模式
  • 将图形化界面切换成命令行 , 输入命令 systemctl set -default multi-user.target 之后再输入reboot重启即可
  • 将命令行切换成图形化界面的命令 systemctl set-default graphical.target 之后再输入reboot重启即可
Linux 虚拟机 ifconfig 
        ip : 192.168.7.248
        本地 ip :  xxx.xxx.xxx.xxx
关闭Linux虚拟机防火墙 (参考网址 https://blog.csdn.net/zhezhebie/article/details/72881393)
        firewall-cmd --state #查看默认防火墙状态 (关闭后显示notrunning , 开启后显示running)
        systemctl stop firewalld.service #停止firewall
        systemctl disable firewalld . service # 机制firewall 开机启动
        init 6 #重启虚拟机, 然后输入第一条命令查看防火墙状态
安装jdk之前,先进行卸载jdk ( 安装版本 java-1.7.0-openjdk.x86_64 )
  • 查询jdk版本 java -version
  • 检测jdk安装包 rpm -qa | grep java
  • 卸载openjdk   rpm -e --nodeps java-1.8.0-openjdk-1.8.0.102-4.b14.el7.x86_64
  • 或者是   yum remove *openjdk*
  • 再次输入 rpm -qa | grep java
  • 下载jdk1.8 linux版本 , 移动至linux==>root下
  • 解压缩 tar -xzvf jdk-7u25-linux-x64.tar.gz
  • 移动解压包到指定目录    mv /root/jdk1.8.0_171/  /usr/java
  • 编辑环境变量 vim /etc/profile
    • export JAVA_HOME=/usr/java/jdk1.8.0_171
    • export JRE_HOME=${JAVA_HOME}/jre
    • export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib:$CLASSPATH
    • export JAVA_PATH=${JAVA_HOME}/bin:${JRE_HOME}/bin
    • export PATH=$PATH:${JAVA_PATH}
    • esc [进入命令模式]       输入 :   (冒号)   [ wq表示退出保存    q!  退出不保存 ]
  • 重启服务   source /etc/profile
  • 测试是否安装成功 
    • javac
    • java -version

  • M  - IP : 192.168.7.248
  • S1 - IP : 192.168.5.173
  • S2 - IP : 192.168.5.83
  • 创建公钥 / 密钥 ssh-keygen -t rsa
  • 查看两个刚生成的文件 ll ~/.ssh
    • 也可以 ,同样可以看到
    • cd .ssh 
    • ls
  • 在每一个虚拟机中都执行创建密钥.公钥之后
    • 拷贝公钥到需要免密的虚拟机上 
      • M虚拟机命令
      • ssh-copy-id root@192.168.5.173
      • ssh-copy-id root@192.168.5.83
      • S1虚拟机命令
      • ssh-copy-id root@192.168.7.248
      • ssh-copy-id root@192.168.5.83
      • S2虚拟机命令
      • ssh-copy-id root@192.168.7.248
      • ssh-copy-id root@192.168.5.173
  • ssh root@192.168.7.248   进行连接测试

无关重要得一步 ( 纯看个人喜好 )
起别名
  • vi /etc/sysconfig/network
    • NETWORKING=YES
    • HOSTNAME=M ( 别名 )
  • vi /etc/hosts
    • 127.0.0.1   localhost M ( 别名 ) localhost4 localhost4.localdomain4
    • ::1         localhost localhost.localdomain localhost6 localhost6.localdomain6
  • 重启 reboot

  • 进行Hadoop解压 , 指令 tar -xzvf hadoop-2.9.1.tar.gz 
    • 解压包中相关文件
    • sbin: 启动活停止hadoop相关服务的脚本
    • bin: 对hadoop相关服务(HDFS,YARN)进行操作的脚本
    • etc:hadoop的配置文件目录
    • share:hadoop的依赖jar包和文档,文档可以被删除
    • lib:hadoop的本地库(对数据库进行压缩解压缩功能的)
  • 修改这3台机器的/etc/hosts文件,在文件中添加以下内容:
    • 192.168.8.203  hserver1
  • 192.168.8.206  hserver2
    • 192.168.8.207  hserver3
  • 创建文件加
mkdir  /root/hadoop
mkdir  /root/hadoop/tmp
mkdir  /root/hadoop/var
mkdir  /root/hadoop/dfs
mkdir  /root/hadoop/dfs/name
mkdir  /root/hadoop/dfs/data

  • 配置Hadopp配置有关文件
    • vim hadoop-env.sh
      • export JAVA_HOME=/usr/java/jdk1.8.0_171

  • vim /opt/hadoop/hadoop-2.9.1/etc/hadoop/core-site.xml
修改为

<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/root/hadoop/tmp</value>
        <description>Abase for other temporary directories.</description>
    </property>
    <property>
        <name>fs.default.name</name>
        <value> hdfs://localhost:9000 </value>
    </property>
</configuration>
  • vim /opt/hadoop/hadoop-2.9.1/etc/hadoop/hdfs-site.xml
<configuration>
<property>
   <name>dfs.name.dir</name>
   <value>/root/hadoop/dfs/name</value>
   <description>Path on the local filesystem where theNameNode stores the namespace and transactions logs persistently.</description>
</property>
<property>
   <name>dfs.data.dir</name>
   <value>/root/hadoop/dfs/data</value>
   <description>Comma separated list of paths on the localfilesystem of a DataNode where it should store its blocks.</description>
</property>
<property>
   <name>dfs.replication</name>
   <value>2</value>
</property>
<property>
      <name>dfs.permissions</name>
      <value>false</value>
      <description>need not permissions</description>
</property>
</configuration>

  • 复制这个文件并改名有一个名为mapred-site.xml.template的文件,复制该文件,然后改名为mapred-site.xml
  • cp /opt/hadoop/hadoop-2.9.1/etc/hadoop/mapred-site.xml.template /opt/hadoop/hadoop-2.9.1/etc/hadoop/mapred-site.xml
  • 修改这个文件
<property>
    <name>mapred.job.tracker</name>
    <value>hserver1:49001</value>
</property>
<property>
      <name>mapred.local.dir</name>
       <value>/root/hadoop/var</value>
</property>
<property>
       <name>mapreduce.framework.name</name>
       <value>yarn</value>
</property>

  • 修改/opt/hadoop/hadoop-2.9.0/etc/hadoop/slaves文件,将里面的localhost删除,添加如下内容
    • vim /opt/hadoop/hadoop-2.9.1/etc/hadoop/slaves
      • hserver2  
      • hserver3

  • vim /opt/hadoop/hadoop-2.9.1/etc/hadoop/yarn-site.xml
<property>
        <name>yarn.resourcemanager.hostname</name>
        <value>hserver1</value>
   </property>
   <property>
        <description>The address of the applications manager interface in the RM.</description>
        <name>yarn.resourcemanager.address</name>
        <value>${yarn.resourcemanager.hostname}:8032</value>
   </property>
   <property>
        <description>The address of the scheduler interface.</description>
        <name>yarn.resourcemanager.scheduler.address</name>
        <value>${yarn.resourcemanager.hostname}:8030</value>
   </property>
   <property>
        <description>The http address of the RM web application.</description>
        <name>yarn.resourcemanager.webapp.address</name>
        <value>${yarn.resourcemanager.hostname}:8088</value>
   </property>
   <property>
        <description>The https adddress of the RM web application.</description>
        <name>yarn.resourcemanager.webapp.https.address</name>
        <value>${yarn.resourcemanager.hostname}:8090</value>
   </property>
   <property>
        <name>yarn.resourcemanager.resource-tracker.address</name>
        <value>${yarn.resourcemanager.hostname}:8031</value>
   </property>
   <property>
        <description>The address of the RM admin interface.</description>
        <name>yarn.resourcemanager.admin.address</name>
        <value>${yarn.resourcemanager.hostname}:8033</value>
   </property>
   <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
   </property>
   <property>
        <name>yarn.scheduler.maximum-allocation-mb</name>
        <value>2048</value>
        <discription>每个节点可用内存,单位MB,默认8182MB</discription>
   </property>
   <property>
        <name>yarn.nodemanager.vmem-pmem-ratio</name>
        <value>2.1</value>
   </property>
   <property>
        <name>yarn.nodemanager.resource.memory-mb</name>
        <value>2048</value>
</property>
   <property>
        <name>yarn.nodemanager.vmem-check-enabled</name>
        <value>false</value>
</property>


进行测试阶段 :
对HDFS进行格式化
  • cd  /opt/hadoop/hadoop-2.9.1/bin
  • ./hadoop  namenode  -format
  • 格式化成功后,可以在看到在/root/hadoop/dfs/name/目录多了一个current目录,而且该目录内有一系列文件
在namenode上执行启动命令
  • 因为hserver1是namenode,hserver2和hserver3都是datanode,所以只需要再hserver1上执行启动命令即可。
  • 进入到hserver1这台机器的/opt/hadoop/ hadoop-2.9.1/sbin目录,也就是执行命令:
  • cd    /opt/hadoop/ hadoop-2.9.1/sbin
  • 执行初始化脚本,也就是执行命令
  • ./start-all.sh
http://192.168.7.248/50070
http://192.168.7.248/8088
如果没什么错误的情况下,到这里就完事大吉了 >_<


  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
未来社区的建设背景和需求分析指出,随着智能经济、大数据、人工智能、物联网、区块链、云计算等技术的发展,社区服务正朝着数字化、智能化转型。社区服务渠道由分散向统一融合转变,服务内容由通用庞杂向个性化、服务导向转变。未来社区将构建数字化生态,实现数据在线、组织在线、服务在线、产品智能和决策智能,赋能企业创新,同时注重人才培养和科研平台建设。 规划设计方面,未来社区将基于居民需求,打造以服务为中心的社区管理模式。通过统一的服务平台和应用,实现服务内容的整合和优化,提供灵活多样的服务方式,如推送式、订阅式、热点式等。社区将构建数据与应用的良性循环,提高服务效率,同时注重生态优美、绿色低碳、社会和谐,以实现幸福民生和产业发展。 建设运营上,未来社区强调科学规划、以人为本,创新引领、重点突破,统筹推进、整体提升。通过实施院落+社团自治工程,转变政府职能,深化社区自治法制化、信息化,解决社区治理中的重点问题。目标是培养有活力的社会组织,提高社区居民参与度和满意度,实现社区治理服务的制度机制创新。 未来社区的数字化解决方案包括信息发布系统、服务系统和管理系统。信息发布系统涵盖公共服务类和社会化服务类信息,提供政策宣传、家政服务、健康医疗咨询等功能。服务系统功能需求包括办事指南、公共服务、社区工作参与互动等,旨在提高社区服务能力。管理系统功能需求则涉及院落管理、社团管理、社工队伍管理等,以实现社区治理的现代化。 最后,未来社区建设注重整合政府、社会组织、企业等多方资源,以提高社区服务的效率和质量。通过建立社区管理服务综合信息平台,提供社区公共服务、社区社会组织管理服务和社区便民服务,实现管理精简、高效、透明,服务快速、便捷。同时,通过培育和发展社区协会、社团等组织,激发社会化组织活力,为居民提供综合性的咨询和服务,促进社区的和谐发展。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值