HIVE与RDBMS的区别

最新推荐文章于 2021-04-16 19:40:31 发布

zx8167107

最新推荐文章于 2021-04-16 19:40:31 发布

阅读量3.4k

点赞数 3

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zx8167107/article/details/79114620

版权

最近做到一份大数据平台相关的笔试题，问答题第一题就是简述HIVE与RDBMS关系数据库的区别，虽然自己这两种技术都摸过、使用过（HIVE只是了解过，主要使用的是阿里云的odps，rdbms的话主要是mysql），

但是突然问我这样一个问题，我还从来没认真总结过，自我感觉答得不算好，回来百度了网上的资料，在这里就简单总结下。

1、hive存储的数据量比较大，适合海量数据，适合存储轨迹类历史数据，适合用来做离线分析、数据挖掘运算，

事务性较差，实时性较差

rdbms一般数据量相对来说不会太大，适合事务性计算，实时性较好，更加接近上层业务

2、hive的计算引擎是hadoop的mapreduce，存储是hadoop的hdfs文件系统，

rdbms的引擎由数据库自己设计实现例如mysql的innoDB，存储用的是数据库服务器本地的文件系统

3、hive由于基于hadoop所以存储和计算的扩展能力都很好，

rdbms在这方面比较弱，比如orcale的分表和扩容就很头疼

4、hive表格没有主键、没有索引、不支持对具体某一行的操作，适合对批量数据的操作，不支持对数据的update操作，

更新的话一般是先删除表然后重新落数据

rdbms事务性强，有主键、索引，支持对具体某一行的增删改查等操作

5、hive的SQL为HQL，与标准的RDBMS的SQL存在有不少的区别，相对来说功能有限

rdbms的SQL为标准SQL，功能较为强大。

6、（原文https://www.cnblogs.com/sharpxiajun/archive/2013/06/02/3114180.html中摘录，感谢原作者）

Hive在加载数据时候和rdbms关系数据库不同，hive在加载数据时候不会对数据进行检查，也不会更改被加载的数据文件，

而检查数据格式的操作是在查询操作时候执行，这种模式叫“读时模式”。在实际应用中，写时模式在加载数据时候会对列进行

索引，对数据进行压缩，因此加载数据的速度很慢，但是当数据加载好了，我们去查询数据的时候，速度很快。但是当我们的

数据是非结构化，存储模式也是未知时候，关系数据操作这种场景就麻烦多了，这时候hive就会发挥它的优势。

rdbms里，表的加载模式是在数据加载时候强制确定的（表的加载模式是指数据库存储数据的文件格式），如果加载数据

时候发现加载的数据不符合模式，关系数据库则会拒绝加载数据，这个就叫“写时模式”，写时模式会在数据加载时候对数据模

式进行检查校验的操作。

------------------------------------------------------------------------------------------------------------------------------------

最后做下总结，HIVE是数据仓库适合存储历史的海量的数据，适合做批量和海量复杂运算，事务性差，运算时间长。

RDBMS是数据库，存储数据量偏小一些，事务性强，适合做OLTP和OLAP业务，运算时间短。

关注

3
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
HIVE与RDBMS的区别

最近做到一份大数据平台相关的笔试题，问答题第一题就是简述HIVE与RDBMS关系数据库的区别，虽然自己这两种技术都摸过、使用过（HIVE只是了解过，主要使用的是阿里云的odps，rdbms的话主要是mysql），但是突然问我这样一个问题，我还从来没认真总结过，自我感觉答得不算好，回来百度了网上的资料，在这里就简单总结下。1、hive存储的数据量比较大，适合海量数据，适合存储轨迹类历
复制链接

扫一扫

zx8167107 CSDN认证博客专家 CSDN认证企业博客

码龄14年

56: 原创

8万+: 周排名

59万+: 总排名

22万+: 访问

: 等级

2543: 积分

28: 粉丝

55: 获赞

18: 评论

202: 收藏

私信

关注

热门文章

分类专栏

最新评论

GraphX入门简介
l1452873818: 还有咱们的国产原生图数据库Galaxybase
GraphX入门简介
dream-of-cow: 图计算领域除了GraphX, 还有GraphScope, GraphLab, PowerGraph, Giraph, NetworkX等等。Graphx在传统的图计算场景中，会遇到图计算问题复杂，计算模式多样。GraphScope,是阿里巴巴达摩院研发的一站式图计算平台，目前在GitHub上有开源的，感兴趣的大佬们可以去github上试试https://github.com/alibaba/graphscope
GraphX入门简介
Maloriexxxxx: GraphX类似的软件有哪些？
2道算法题
calmerman: 可以优化成 mid = end + (end - start) / 2 这不必溢出吗？ mid = start + (end - start) / 2
python多线程分块读文件
Tisfy: 好像拨开云雾见青天

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。