Hadoop企业级应用之秒级查询Kudu+Impala

智扬信达

已于 2022-02-28 18:57:57 修改

阅读量1.3k

点赞数

分类专栏：技术文章标签： hadoop big data hbase

于 2022-02-28 18:31:04 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zizhu365/article/details/123188904

版权

技术专栏收录该内容

7 篇文章 0 订阅

订阅专栏

Apache Kudu是开源Apache Hadoop生态系统的新成员，它完善了Hadoop的存储层，可以快速分析快速数据。

Apache Impala是CDH的集成部分，通过Cloudera Enterprise订阅支持，是Apache Hadoop的开源分析MPP数据库，可以提供最快的洞察时间。

在Kudu出现之前，Hadoop生态环境中的储存主要依赖HDFS和HBase，追求高吞吐批处理的用例中使用HDFS，追求低延时随机读取用例下用HBase，而Kudu正好能兼顾这两者：

• Kudu的设计使它与众不同：

o 快速处理OLAP（Online Analytical Processing）任务

o 集成MapReduce、Spark和其他Hadoop环境组件

o 与Impala高度集成，使得这成为一种高效访问交互HDFS的方法

o 强大而灵活的统一性模型

o 在执行同时连续随机访问时表现优异

o 通过Cloudera Manager可以轻松管理控制

o 高可用性，tablet server和master利用Raft Consensus算法保证节点的可用

o 结构数据模型

• 常见的应用场景：

o 刚刚到达的数据就马上要被终端用户使用访问到

o 同时支持在大量历史数据中做访问查询和某些特定实体中需要非常快响应的颗粒查询

o 基于历史数据使用预测模型来做实时的决定和刷新

o 要求几乎实时的流输入处理

• Kudu+Impala集成功能：

o CREATE/ALTER/DROP TABLE

Impala支持使用Kudu作为持久层创建，更改和删除表。这些表遵循与Impala中其他表相同的内部/外部方法，允许灵活的数据提取和查询。

o INSERT

可以使用与任何其他Impala表相同的语法将数据插入Impala中的Kudu表，例如使用HDFS或HBase进行持久化的表。

o UPDATE / DELETE

Impala支持UPDATE和DELETESQL命令逐行或批量修改Kudu表中的现有数据。选择SQL命令的语法与现有标准尽可能兼容。除了simple DELETE 或UPDATE命令之外，还可以使用FROM子查询中的子句指定复杂连接。

o 灵活的分区

与Hive中的表分区类似，Kudu允许通过散列或范围动态地将表预分割为预定义数量的节点，以便在集群中均匀分配写入和查询。可以按任意数量的主键列，任意数量的哈希值和可选的拆分行列表进行分区。

o 并行扫描

为了在现代硬件上实现最高性能，Impala使用的Kudu客户端课在多台节点上并行扫描。

o 高效查询

在可能的情况下，Impala将谓词评估推送到Kudu，以便尽可能接近数据评估谓词。在许多工作负载中，查询性能与Parquet相当。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Hadoop企业级应用之秒级查询Kudu+Impala

在Kudu出现之前，Hadoop生态环境中的储存主要依赖HDFS和HBase，追求高吞吐批处理的用例中使用HDFS，追求低延时随机读取用例下用HBase，而Kudu正好能兼顾这两者：...
复制链接

扫一扫

专栏目录

智扬信达 CSDN认证博客专家 CSDN认证企业博客

码龄16年

17: 原创

25万+: 周排名

19万+: 总排名

1万+: 访问

: 等级

203: 积分

19: 粉丝

8: 获赞

2: 评论

32: 收藏

私信

关注

热门文章

分类专栏

业务 7篇
技术 7篇
案例 3篇
转载

最新评论

用数据分析和模拟预测找到产销协同的最优解
CSDN-Ada助手: 恭喜您撰写了第17篇博客！标题“用数据分析和模拟预测找到产销协同的最优解”非常吸引人。您通过数据分析和模拟预测的方法，为产销协同问题提供了一种最优解，这对于相关领域的研究和实践非常有价值。在下一步的创作中，我谦虚地建议您可以进一步探究如何优化数据分析和模拟预测的方法，以提高预测准确度和效果。您可以考虑引入更多的变量、优化算法或采用更精细化的建模方法等。此外，您也可以探讨如何将这种最优解应用于实际产销协同场景中，以便更好地指导相关业务决策。期待您的下一篇博客，再次祝贺您的持续创作！
智扬数字化经营分析产品的价值
CSDN-Ada助手: 恭喜您撰写了第16篇博客！标题“智扬数字化经营分析产品的价值”引人入胜。您对数字化经营分析产品的洞察力令人印象深刻，展示了这些产品在商业世界中的巨大潜力。在接下来的创作中，或许可以考虑探讨一些具体案例，分享数字化经营分析产品在实际运营中的成功应用，这将进一步丰富您的博客内容。期待您的下一篇作品，再次恭喜您！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

智扬信达 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。