- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 Impala源码之订阅发布系统的实现
众所周知,Impala包含三个模块,分别是impalad、catalogd和statestored,其中statestored模块的作用是实现一个业务无关的订阅(Subscribe)发布(Publish)系统,catalod和impalad中的部分消息传递需要通过statestored传递,为什么要使用这样一个业务无关的服务来传递消息呢?下面我们来揭开它神秘的面纱。
2017-02-28 20:26:04 1762
转载 【转载】SQL on Hadoop中用到的主要技术——MPP vs Runtime Framework
个人觉得该文章对于诸如Impala这样的MPP架构的SQL引擎和Runtime Framework架构的Hive/Spark SQL进行对比,感觉总结的特别好,并且和本人最近的公司相近,学习转载之。
2017-02-13 20:56:09 3187
原创 Hiveserver2的代理执行之路
hiveserver2的代理访问可以使得平台端代理任意用户执行SQL操作就像该用户自己执行的操作一样(就像一个普通用户直接使用hive CLI执行操作),本文主要探索hiveserver2是如何使用代理的方式实现支持不同用户完成SQL操作,为修改impala支持对应的操作做铺垫。
2017-02-10 13:55:52 11525
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人