
Hive的架构
语言(HiveQL)将结构化数据映射为 Hadoop 的 MapReduce、Tez 或 Spark 任务,适合离线批处理,尤其适用于数据仓库场景(如 ETL、报表生成)。2.外部表(External Table):数据存储在 HDFS 的指定路径,删除表仅删除元数据,保留数据。支持多种引擎:MapReduce(默认)、Tez(优化 DAG 执行)、Spark(内存计算)。:按列值(如日期)将数据划分到不同目录,提升查询效率(如分区裁剪)。Metastore:独立服务,管理元数据,支持高并发访问。





















