Hive在实际运用中主要起来数据仓库的作用,通过元数据将hadoop的hdfs数据映射成表,通过操作sql的方法操作数据,进行数据清洗、处理,通常跟Hbase\其它数据库配合使用,Hive的版本跟Hadoop的版本有一个匹配关系,因为Hadoop我升级到了3.2版本,对应Hive选择了3.1.2版本;
1.解压安装包
tar -xvf apache-hive-3.1.2-bin.tar.gz
2.配置环境变量
vi /etc/profile
export HIVE_HOME=/data1/apache-hive-3.1.2-bin
source /etc/profile 让环境变量生效
hive --version 查看版本号
3.配置文件
3.1配置hive-site.xml
用模板文件生成配置文件
cp hive-default.xml.template hive-site.xml
vi hive-site.xml 主要配置mysql地址,mysql主要是存一些元数据的数据库,mysql提前安装好
javax.jdo.option.ConnectionUserName 数据库的用户名
javax.jdo.option.ConnectionPassword 数据库帐号的密码