大数据hive，storm小知识（干货）

最新推荐文章于 2022-12-25 22:32:55 发布

VIP文章 xinxindsj

最新推荐文章于 2022-12-25 22:32:55 发布

阅读量592

点赞数 1

分类专栏：互联网大数据人工智能文章标签：大数据大数据开发大数据分析 hive storm

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xinxindsj/article/details/103807980

版权

Hive简介

定义

Facebook为了解决海量日志数据的分析而开发了hive，后来开源给了Apache基金会组织。 hive是一种用SQL语句来协助读写、管理存储在HDFS上的大数据集的数据仓库软件。

为什么要使用Hive?

1) 从SQL角度，简单、容易上手、使用方便。

2) 从Hadoop角度，可以操作大规模的数据集，可以作为大数据的引擎。

3) 从MetaStore角度:有了这个之后，这些框架Pig/Impala/Presto/SparkSQL跟Hive可以共享元数据信息，

共享元数据即他们之间的元数据可以互通访问的，比如在Hive创建一张表，可以在SparkSQL能用，也可以在 Presto,Impala，Pig用。相反，在SparkSQL创建的表，在HIVE,Pig,Impala,Presto也能用。因为他们底层都是共享MetaStore。

Hive原理：

大数据hive，storm小知识（干货）

hive内核：

hive 的内核是驱动引擎，驱动引擎由四部分组成，这四部分分别是：
▪解释器：解释器的作用是将hiveS

最低0.47元/天解锁文章

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
大数据hive，storm小知识（干货）

Hive简介定义Facebook为了解决海量日志数据的分析而开发了hive，后来开源给了Apache基金会组织。 hive是一种用SQL语句来协助读写、管理存储在HDFS上的大数据集的数据仓库软件。为什么要使用Hive?1) 从SQL角度，简单、容易上手、使用方便。2) 从Hadoop角度，可以操作大规模的数据集，可以作为大数据的引擎。3) 从MetaStore角度:有了这...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。