文章目录
1. 安装前提
集群前提安装好hadoop,hive。
hive安装包scp在所有需要安装impala的节点上,因为impala需要引用hive的依赖包。
hadoop框架需要支持C程序访问接口,查看下图,如果有该路径下有这么文件,就证明支持C接口。
2. 下载安装包,依赖包
由于impala没有提供tar包进行安装,只提供了rpm包。因此在安装impala的时候,需要使用rpm包来进行安装。rpm包只有cloudera公司提供了,所以去cloudera公司网站进行下载rpm包即可。
但是另外一个问题,impala的rpm包依赖非常多的其他的rpm包,可以一个个的将依赖找出来,也可以将所有的rpm包下载下来,制作成我们本地yum源来进行安装。这里就选择制作本地的yum源来进行安装。
所以首先需要下载到所有的rpm包,下载地址如下
下载地址
3. 虚拟机新增磁盘 (磁盘空间有余则跳过此步骤)
由于下载的cdh5.14.0-centos6.tar.gz包非常大,大概5个G,解压之后也最少需要5个G的空间。而我们的虚拟机磁盘有限,可能会不够用了,所以可以为虚拟机挂载一块新的磁盘,专门用于存储的cdh5.14.0-centos6.tar.gz包。
注意事项:新增挂载磁盘需要虚拟机保持在关机状态。
3.1 关机新增磁盘
虚拟机关机的状态下,在VMware当中新增一块磁盘。
3.2 开机挂载磁盘
开启虚拟机,对新增的磁盘进行分区,格式化,并且挂载新磁盘到指定目录。
下面对分区进行格式化操作:
[root@node-3 /]# mkfs -t ext4 /dev/sdb1
创建挂载目录:
[root@node-3 /]# mount -t ext4 /dev/sdb1 /cloudera_data/
添加至开机自动挂载:
[root@node-3 /]# vim /etc/fstab
修改成以下内容:
/dev/sdb1 /cloudera_data ext4 defaults 0 0
4. 配置本地 yum 源
4.1 上传安装包解压
使用sftp的方式把安装包大文件上传到服务器/cloudera_data目录下。
[root@node-3 /]# cd /cloudera_data
[root@node-3 cloudera_data]# tar -zxvf cdh5.14.0-centos6.tar.gz
4.2 配置本地yum源信息
安装 Apache Server服务器
## 安装httpd服务
[root@node-3 /]# yum -y install httpd
## 启动httpd服务
[root@node-3 /]# service httpd start
## 开机自动启动httpd服务
[root@node-3 /]# chkconfig httpd on
配置本地 yum 源的文件
## 进入yum 配置文件
[root@node-3 /]# cd /etc/yum.repos.d/
## 创建文件夹
[root@node-3 yum.repos.d]