hive java api 设计_hive的设计思想和技术框架（2017）

最新推荐文章于 2023-09-03 08:00:00 发布

岐黄医士

最新推荐文章于 2023-09-03 08:00:00 发布

阅读量140

点赞数

文章标签： hive java api 设计

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_34142735/article/details/114236425

版权

2019/2/20 星期三

此笔记参考2017年优化与2019/2/20 星期三

Hive的设计思想和技术架构

Hive的基础

Hive是一种数据仓库工具，他的功能是讲SQL语法表达的数据运算逻辑转换为mapreduce程序在hadoop集群上对海量数据进行分析 //hive表是可以创建索引的 https://www.iteblog.com/archives/836.html //Hive创建索引

hive的设计思想

库：sql语法表达成MapReduce的jar库

因为，sql语法相对是一个规则的东西，我们把sql语法用MapReduce来表达出来，形成一个库

翻译器：可以接受sql语句，然后去翻译，查找一个特定的mr程序。

1、翻译器接受sql语句，然后去翻译，

2、到sql库中查找一个特定的mr程序。

3、提交hadoop集群上执行MR job

其实：hive就是翻译器+库+元数据库这三者封装起来就是hive

HiveQL 通过命令行或者客户端提交，经过 Compiler 编译器，运用 MetaStore 中的元数据进行类型检测和语法分析，生成一个逻辑方案(Logical Plan)，然后通过的优化处理，产生一个 MapReduce 任务。

hive中建立表语句：其实就是建立一种映射关系，这种映射关系就是表名，表里面的字段，字段跟hdfs路径上的字段怎么对应起来，他要记录这些信息，把这些信息记录在元数据库中

hive的技术架构 //见图

其中最重要的是driver：包括编译器，优化器，执行器

metastore 元数据库：可以是mysql，他自身携带了一个叫derby的数据库

安装hive

首先在官网下载hive，上传到linux中解压到我们安装的目录下面，这里我们是安装在/usr/local/apps/下的

tar -zxvf hive(压缩包) -C /usr/local/apps/

然后我们到安装目录下查看

cd /usr/local/apps/

hive 这个工具是不需要再每台机器上安装，他提供一个界面给我们，把SQL变成mr程序，提交给hadoop集群去执行，所以他在那边运行都没关系

hive

hive依赖与hadoop的集群环境，他运算所用的框架是mr所以在运行hive之前要确保hadoop的开启

首先 start-dfs.sh

start-yarn.sh

然后在hive的安装包下的bin目录下有一个hive可以直接运行hive

./hive

这样就启动起来了

进入hive> 他是支持sql语句的，我们来执行show databases

show table

hive的4中使用方式：https://blog.csdn.net/ansiallen/article/details/79427468 //参考链接

1、Hi

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hive java api 设计_hive的设计思想和技术框架（2017）

2019/2/20 星期三此笔记参考2017年优化与2019/2/20 星期三Hive的设计思想和技术架构Hive的基础Hive是一种数据仓库工具，他的功能是讲SQL语法表达的数据运算逻辑转换为mapreduce程序在hadoop集群上对海量数据进行分析 //hive表是可以创建索引的 https://www.iteblog.com/archives/836.html //Hive创建索...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。