温馨提示::安装Impala之后hdfs 和hive可能会出点问题,请提前准备好快照
1. 安装前提
集群提前安装好hadoop,hive。
hive安装包scp在所有需要安装impala的节点上,因为impala需要引用hive的依赖包。
hadoop框架需要支持C程序访问接口,查看下图,如果有该路径下有这么文件,就证明支持C接口。
2. 下载安装包、依赖包
由于impala没有提供tar包进行安装,只提供了rpm包。因此在安装impala的时候,需要使用rpm包来进行安装。rpm包只有cloudera公司提供了,所以去cloudera公司网站进行下载rpm包即可。
但是另外一个问题,impala的rpm包依赖非常多的其他的rpm包,可以一个个的将依赖找出来,也可以将所有的rpm包下载下来,制作成我们本地yum源来进行安装。这里就选择制作本地的yum源来进行安装。
所以首先需要下载到所有的rpm包,下载地址如下
http://archive.cloudera.com/cdh5/repo-as-tarball/5.14.0/cdh5.14.0-centos6.tar.gz
3. 虚拟机新增磁盘(可选)
由于下载的cdh5.14.0-centos6.tar.gz包非常大,大概5个G,解压之后也最少需要5个G的空间。而我们的虚拟机磁盘有限,可能会不够用了,所以可以为虚拟机挂载一块新的磁盘,专门用于存储的cdh5.14.0-centos6.tar.gz包。
注意事项:新增挂载磁盘需要虚拟机保持在关机状态
如果磁盘空间有余,那么本步骤可以省略不进行。
挂载磁盘,配置网络源我的博客里面有直接看那个就行,这里就不详细的说了
4. 配置本地yum源
4.1. 上传安装包解压
使用sftp的方式把安装包大文件上传到服务器/cloudera_data目录下。
cd /cloudera_data
tar -zxvf cdh5.14.0-centos6.tar.gz
4.2. 配置本地yum源信息
安装Apache Server服务器
yum -y install httpd
service httpd start
chkconfig httpd on
配置本地yum源的文件
cd /etc/yum.repos.d
vim localimp.repo
[localimp]
name=localimp
baseurl=http