Hive简介以及原理

最新推荐文章于 2021-07-12 09:40:43 发布

A210810

最新推荐文章于 2021-07-12 09:40:43 发布

阅读量714

点赞数

CC 4.0 BY-SA版权

分类专栏：数仓文章标签： hive

本文链接：https://blog.csdn.net/A210810/article/details/107628531

Hive是一个基于Hadoop的数据仓库工具，提供类SQL接口处理HDFS上的结构化数据。它不支持记录级别的增删改操作，适合离线批量数据计算。Hive的架构分为用户接口、跨语言服务、Driver和数据存储四层，元数据通常存储在MySQL中。其优点包括可扩展性、自定义函数和良好的容错性，但查询延迟高，不适合交互查询。Hive中的表分为内部表和外部表，具有分区和分桶功能，用于数据管理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Hive简介

Hive是用来干什么的？有什么作用？
Hive来源是由脸书实现并开源
是一个基于Hadoop的一个数据仓库，底层数据在Hdfs之上。
可以使用Hve更方便的使用Hql处理和计算HDFS上的结构化的数据，使用与离线的批量数据计算.
Hive可以提供Hql查询功能，可以将数据映射为一张表，Hive本质是将sql语句转换为MapReduce来运行。
Hive 依赖与HDFS存储数据，Hive将Hql转换成MapReduce执行，所以说Hive是基于Hadoop的一个数据仓库工具，是指计算一款基于Hdfs的MapReduce计算框架，对存储在Hdfs中的数据镜像分析和管理。
在这里插入图片描述