一、下载地址
嫌慢可以找国内镜像资源下载
http://archive.apache.org/dist/hive/
国内镜像地址
https://mirrors.tuna.tsinghua.edu.cn/apache/hive/hive-3.1.3/
二、安装
我是把报丢在了这个路径下
2.1 解压
tar -zvxf apache-hive-3.1.3-bin.tar.gz
2.2 配置环境变量
vim /etc/profile.d/my_env.sh
#HIVE_HOME
export HIVE_HOME=/usr/local/src/hive/apache-hive-3.1.3-bin
export PATH=$PATH:$HIVE_HOME/bin
source一下
source /etc/profile.d/my_env.sh
2.3 初始化元数据库
/usr/local/src/hive/apache-hive-3.1.3-bin/bin/schematool -dbType derby -initSchema
2.4 启动并使用
/usr/local/src/hive/apache-hive-3.1.3-bin/bin/hive
3、测试
3.1查询数据库,出现以下内容则表示成功
show databses;
当没有使用 use 数据库名称;将默认使用deafault数据库。
3.2 创建表
create table stu(id int,name string);
3.3插入数据
insert into stu values(1,"ss");
数据与HDFDS
hive的数据是存储在hadoop的HDFS上的
在另一台服务器启动hive会报错
原因在于Hive默认使用的元数据库为derby。derby数据库的特点是同一时间只允许一个客户端访问。如果多个Hive客户端同时访问,就会报错。
由于在企业开发中,都是多人协作开发,需要多客户端同时访问Hive,怎么解决呢?我们可以将Hive的元数据改为用MySQL存储,MySQL支持多客户端同时访问。