Hadoop hive 简述及安装
一、官网说明
-
wiki文档-Confluence
-
The Apache Hive™ data warehouse software facilitates reading, writing, and managing large datasets residing in distributed storage and queried using SQL syntax.
- hive是一款软件,支持在大数据分布式存储上读、写、管理,查询使用 SQL 句法
-
特性
- 支持 extract/transform/load (ETL), reporting, and data analysis
- A mechanism to impose structure on a variety of data formats
- 支持访问 HDFS\Hbase
- 查询引擎:Apache Tez™, Apache Spark™, or MapReduce
- 程序语言 HPL-SQL
- Sub-second query retrieval via Hive LLAP, Apache YARN and Apache Slider.
二、下载软件
- Hive 3.1.2 下载地址
- 当前版本依赖 Hadoop 3.x.y
- 下载
# 下载安装包
wget https://blog.csdn.net/qq_25951401/article/details/110766285
# 解压
tar -zxvf apache-hive-3.1.2-bin.tar.gz
# 移动目录
mv apache-hive-3.1.2-bin /opt/
cd /opt
# 创建软链接
ln -s apache-hive-3.1.2-bin hive
三、安装软件
- 配置环境变量