Hadoop集群和Hive的搭建

本文详细介绍了如何搭建Hadoop伪分布式和集群环境,包括配置SSH无密码登录、安装Java、设置Hadoop配置文件等步骤。接着,文章讲解了Hive的安装和配置过程,包括安装Hive、配置环境变量、解决启动时的错误问题。在Hadoop集群的搭建中,特别提到了集群网络配置、主机名与IP映射、SSH公钥授权等关键步骤。在Hive搭建中,重点解决了guava.jar版本冲突的问题。
摘要由CSDN通过智能技术生成

1.伪分布式的搭建.
搭建过程中遇到的其中一个问题并将解决办法进行了记录:
启动HDFS时报错localhost: Warning: Permanently added ‘localhost‘ (ECDSA)Permission denied
搭建伪分布式主要分为了如下几个步骤:配置SSH无密码登录,安装Java环境,安装Hadoop环境,配置core-site.xml、hdfs-site.xml文件 以及名称节点初始化即可使用。
2.集群的搭建:(由于内容多,从原文进行了部分粘贴厦门大学林子雨老师教程
第一步:配置网络(都为桥接,且mac地址不同)、修改主机名及/etc/hosts文件增加ip与主机名的映射关系,通过ping测试是否可用。
第二步:在主节点重新配置ssh无密码登录
再把公钥id_rsa.pub通过scp传到其他的从节点上去,在从节点中把公钥加入授权。。在~/.ssh下 cat id_rsa.pub >>authorized_keys
第三步:在主节点下配置路径。。在~/.bashrc加入hadoop的bin和sbin子目录
例:export PATH=$PATH:/usr/local/hadoop/bin:/usr/local/hadoop/sbin
第四步:修改主节点下Hadoop的几个配置文件
在配置集群/分布式模式时,需要修改“/usr/local/hadoop/etc/hadoop”目录下的配置文件,这里仅设置正常启动所必须的设置项,包括workers 、core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml共5个文件,更多设置项可查看官方说明。
(1)修改文件workers
需要把所有数据节点的主机名写入该文件,每行一个,默认为 localhost(即把本机作为数据节点),所以,在伪分布式配置时,就采用了这种默认的配置,使得节点既作为名称节点也作为数据节点。在进行分布式配置时,可以保留localhost,让Master节点同时充当名称节点和数据节点,或者也可以删掉localhost这行,让Master节点仅作为名称节点使用。
本教程让Master节点仅作为名称节点使用,因此将workers文件中原来的localhost删除,只添加如下一行内容:
Slave1
(2)修改文件core-site.xml
请把core-site.xml文件修改为如下内容:

<configuration>
        <property>
                <name>fs.defaultFS</name>
                <value>hdfs://Master:9000</value>
        </property>
        <property>
                <name>hadoop.tmp.dir</name>
                <value>file:/usr/local/hadoop/tmp</value>
                <description>Abase for other temporary directories.</description>
        </property>
</configuration>

各个配置项的含义可以参考前面伪分布式模式时的介绍,这里不再赘述。

(3)修改文件hdfs-site.xml
对于Hadoop的分布式文件系统HDFS而言,一般都是采用冗余存储,冗余因子通常为3,也就是说,一份数据保存三份副本。但是,本教程只有一个Slave节点作为数据节点,即集群中只有一个数据节点,数据只能保存一份,所以 ,dfs.replication的值还是设置为 1。hdfs-site.xml具体内容如下:

<configuration>
        <property>
                <name>dfs.namenode.secondary.http-address</name>
                <value>Master:50090</value>
        </property>
        <property>
                <name>dfs.replication</name>
                <value>1
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值