Hive的基本介绍

最新推荐文章于 2023-03-19 13:47:42 发布

爱一半码一半

最新推荐文章于 2023-03-19 13:47:42 发布

阅读量206

点赞数

分类专栏：大数据大数据之Hive 文章标签： hive

本文链接：https://blog.csdn.net/qq_41650354/article/details/109020224

版权

6 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

Apache官网：The Apache Hive ™ data warehouse software facilitates reading, writing, and managing large datasets residing in distributed storage using SQL. Structure can be projected onto data already in storage. A command line tool and JDBC driver are provided to connect users to Hive.
Hive经常被大数据企业用作企业级数据仓库。
Hive在使用过程中是使用SQL语句来进行数据分析，由SQL语句到具体的任务执行还需要经过解释器，编译器，优化器，执行器四部分才能完成。
1. 解释器：调用语法解释器和语义分析器将SQL语句转换成对应的可执行的java代码或者业务代码
2. 编译器：将对应的java代码转换成字节码文件或者jar包
3. 优化器：从SQL语句到java代码的解析转化过程中需要调用优化器，进行相关策略的优化，实现最优的查询性能
4. 执行器：当业务代码转换完成之后，需要上传到MapReduce的集群中执行