大数据系统-SQL on Hadoop构建OLAP的基石

    SQL on Hadoop是泛指大规模并行SQL分析引擎,针对的是分析性应用。和其他关系型数据库或数据仓库类似,接受SQL,返回结果集。但它具有大规模并行处理很多传统数据库以及其他数据库没有的特性及功能。

    系统设计者和用户比较关注其中一些技术点:

  • 接口层:
是否兼容以往SQL标准,迁移以往工作负载以及平滑过渡甲方历史遗留作业。
  • 查询优化器层:
能否将SQL转换为优化的分布式执行作业,深挖分布式环境特点,减少网络传输等传统分布式经典问题。
  • 存储层:

利用分析型数据批量导入,主要为查询负载特点,设计存储格式,如列存储等。


    业界逐渐涌现新的查询系统,根据以往经验可以根据架构进行一定的划分:

  •    SQL on MR 

Spark SQL: http://spark.apache.org/sql/

Hive: https://hive.apache.org/  

  •     MPP

Impala: http://impala.apache.org/

  •     SQL on NoSQL 

Kylin: http://kylin.apache.org/cn/

  •     Time Series Partition

Druid: http://druid.io/

Pinot: https://github.com/linkedin/pinot

    

    每种方案都有各自的优劣,具体需要根据应用场景的工作负载与需求决定选用哪种架构和相应的系统。不建议单纯看个别query的Benchmark结果,体现的问题过于单一,不能代表整体的结果。


友情推荐:ABC技术研习社

为技术人打造的专属A(AI),B(Big Data),C(Cloud)技术公众号和技术交流社群。




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值