生产实习Day06--大数据分析实例

桑桑塔纳沂

已于 2024-06-13 15:29:21 修改

阅读量270

点赞数 6

文章标签： java hadoop hive

于 2024-06-13 13:58:01 首次发布

本文链接：https://blog.csdn.net/m0_64090877/article/details/139652322

版权

学习目标：

Hive是一个基于Hadoop的开源数据仓库工具，用于存储和处理海量结构化数据。它是Facebook 2008年8月开源的一个数据仓库框架，提供了类似于SQL语法的HQL（hiveSQL）语句作为数据访问接口。
Hive服务端组件：

Driver组件：该组件包括Complier（编译）、Optimizer（优化）和Executor（执行），它的作用是将HiveQL（类SQL）语句进行解析、编译优化，生成执行计划，然后调用底层的MapReduce计算框架。
Metastore组件：元数据服务组件，这个组件存取Hive的元数据，Hive的元数据存储在关系数据库里，Hive支持的关系数据库有Derby和Mysql。作用是：客户端连接metastore服务，metastore再去连接MySQL数据库来存取元数据。
HiveServer2服务：用来进行可扩展且跨语言的服务的开发，Hive集成了该服务，能让不同的编程语言调用Hive的接口，还可做权限管理。

客户端组件：

CLI：Command Line Interface，命令行接口。
JDBC/ODBC：Hive架构的JDBC和ODBC接口是建立在HiveServer2客户端之上。
WEBGUI：Hive客户端提供了一种通过网页的方式访问Hive所提供的服务。这个接口对应Hive的HWI组件（Hive Web Interface），使用前要启动HWI服务。

3.使用Hive的原因

hive运行成功结果截图

关注