作者:翁松秀
什么是Hive?
The Apache Hive™ data warehouse software facilitates reading, writing, and managing large datasets residing in distributed storage and queried using SQL syntax.
Apache Hive™数据仓库软件便于读取、写入和管理存储在分布式存储中的大型数据集,并使用SQL语法进行查询。
Hive的特性
- 支持通过SQL轻松访问数据,从而支持数据仓库任务,如提取/转换/加载(ETL)、报告和数据分析。
- 将结构强加于各种数据格式。
- 可以直接访问HDFS或者Apache HBase上的数据。
- 通过Apache Tez,Apache Spark,MapReduce执行查询(HiveQL)。
- 通过Hive LLAP、Apache YARN和Apache Slider进行亚秒查询检索。