梳理一下流式处理、实时计算、Add-hoc、离线计算、实时查询等区别

最新推荐文章于 2024-04-24 15:10:37 发布

杨步涛的博客

最新推荐文章于 2024-04-24 15:10:37 发布

阅读量1.1w

点赞数 1

分类专栏：云计算

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yangbutao/article/details/8449111

版权

云计算专栏收录该内容

7 篇文章 1 订阅

订阅专栏

流式处理、实时计算、Add-hoc、离线计算、实时查询这几个概念在数据处理中经常提高，这里简单的梳理一下他们的区别。

流处理、实时计算属于一类的，即计算在数据变化时，都是在数据的计算实时性要求比较高的场景，能够实时的响应结果，一般在秒级，Yahoo的S4,twiter的storm都属于流处理和实时计算一类的。

Add-hoc和实时查询都计算在query时，实时查询是响应可能千变万化的结果，无法事先通过枚举得到并存储起来，需要根据用户输入的不同实时查询出不同的响应，对实时性要求比较高，比如hbase，内存数据库的查询redis、mongodb等；Add-hoc属于对实时性要求不高的场景。Add-hoc是针对各种临时的、自定义的需求采取的解决方案，比如hive，需求是不确定的，可以通过编写sql来应对各种问题；最近出现的基于hadoop的实时查询Impala，解决了实时性的要求，比hive效率。

离线计算一般是批量处理数据库的过程，比如利用hadoop的mapreduce；内存计算spark类似于mapreduce，不过是数据是放在在内存中，效率比较高。

杨步涛的博客

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。