Hive/HBase/MySQL数据库比较

最新推荐文章于 2023-09-19 22:29:07 发布

VIP文章蓝喵小可爱

最新推荐文章于 2023-09-19 22:29:07 发布

阅读量561

点赞数 1

分类专栏：大数据

本文链接：https://blog.csdn.net/NaN_Lovelance/article/details/107204731

版权

HIve:

属于大数据生态系统中一个技术框架、用于分析数据
数据仓库ETL工具（ETL，是英文Extract-Transform-Load的缩写，用来描述将数据从来源端经过萃取（extract）、转置（transform）、加载（load）至目的端的过程）
建立在Hadoop之上，为用户提供SQL语句分析海量数据，离线数据分析
底层MapReduce
类似于MYSQL数据库中database和table来组织数据
hive将元数据存储在MYSQL中。

mysql:

属于RDBMS中关系型数据库的一种
数据存储和数据检索
表的数据量不大

区别：

MYSQL是检索数据，hive管理数据，偏向于分析数据

介绍一下Hive。

网上对于hive与mysql的区别的文章也不是很多。so只能问问公司大牛们，看看他们是怎样理解的。

由于 Hive 采用了 SQL 的查询语言 HQL，因此很容易将 Hive 理解为数据库。其实 从结构上来看，Hive 和数据库除了拥有类似的查询语言，再无类似之处。
数据库可以用在 Online 的应用中，但是 Hive 是为数据仓库而设计的，清楚这一点，有助于从应用角度理解 Hive 的特性。

一、Hive是一个基于Hadoop的数据仓库平台。通过hive，我们可以方便地进行ETL的工作。hive定义了一个类似于SQL的查询语言：HQL，能够将用户编写的QL转化为相应的Mapreduce程序基于Hadoop执行。

Hive是Facebook 2008年8月刚开源的一个数据仓库框架，其系统目标与 Pig 有相似之处，但它有一些Pig目前还不支持的机制，比如：更丰富的类型系统、更类似SQL的查询语言、Table/Partition元数据的持久化等。
Hive 可以看成是从SQL到Map-Reduce的映射器

Hive的数据放在哪儿？

数据在HDFS的warehouse目录下，一个表对应一个子目录。

本地的/tmp目录存放日志和执行计划

hive的表分为两种，内表和外表。
Hive 创建内部表时，会将数据移动到数据仓库指向的路径；若创建外部表，仅记录数据所在的路径，不对数据的位置做任何改变。
在删除表的时候，内部表的元数据和数据会被一起删除，而外部表只删除元数据，不删除数据。这样外部表相对来说更加安全些，数据组织也更加灵活，方便共享源数据。

使用Mysql作为Hive metaStore的存储数据库<

最低0.47元/天解锁文章

蓝喵小可爱

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Hive/HBase/MySQL数据库比较

HIve: 属于大数据生态系统中一个技术框架、用于分析数据数据仓库ETL工具（ETL，是英文Extract-Transform-Load的缩写，用来描述将数据从来源端经过萃取（extract）、转置（transform）、加载（load）至目的端的过程）建立在Hadoop之上，为用户提供SQL语句分析海量数据，离线数据分析底层MapReduce 类似于MYSQL数据库中database和table来组织数据 hive将元数据存储在MYSQL中。mysql: 属于RD
复制链接

扫一扫