hive与关系型数据库以及HBase之间的比较

 

       1.2、hive和rdbms的对比

对比项hiverdbms
查询语言HQLsqL
数据存储HDFSraw Device or Local FS
执行器MapReduceExecutor
数据插入支持批量导入/单条插入支持单条或批量导入
数据操作覆盖追加行级更新删除
处理数据规模
执行延迟
分区支持支持
索引0.8版本之后加入简单索引支持负责的索引
扩展性高(好)有限(差)
数据加载模式读时模式(快)写时模式(慢)
应用场景海量数据查询实时查询

 

                         总结:hive具有sql数据库的外表,但应用场景完全不同,hive只适合用来做海量离线数据

                        统计分析,也就是数据仓库。

1.3、hive和hbase的差别

    ①hive是建立在hadoop之上为了降低MapReduce编程复杂度的ETL工具

       HBase是为了弥补Hadoop对实时操作的缺陷

   ②hive表是逻辑表,因为hive的本身并不能做数据存储和计算,而是完全依赖hadoop

       HBase 是物理表,提供了一张超大的内存Hash表来存储索引,方便查询

   ③ hive是数据仓库工具,需要全表扫描,就用hive,因为hive是文件存储

      HBase 是数据库,需要索引访问,则用HBase,因为HBase是面向列的NoSQL数据库

   ④ hive表中存入数据(文件)时不做校验,属于读模式存储系统

       HBase表插入数据时,会和RDBMS一样做Schema校验,所以属于写模式存储系统

   ⑤hive不支持单行记录操作,数据处理依靠MapReduce,操作延时高

     HBase支持单行记录的CRUD,并且是实时处理,效率比Hive高的多

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值