数据中台建设(从方法论到落地实战)-读书笔记5

5 数据计算平台:让数据“飞”起来

5.1 应用场景一:批处理

       批处理计算主要用于处理海量数据,对延时要求不高的场景。最知名的批处理计算框架时Hadoop和Spark框架。目前行业内很多优化的引擎大部分在MR引擎的基础上,引入了很多优化方法,提高了批处理计算的效率和稳定性,但底层的逻辑还是分布式计算逻辑。

5.2 应用场景二:实时计算

5.2.1 实时计算流程       

       实时计算重点解决离线计算时延时高的问题,通过消息队列对实时数据流进行缓存,然后通过流式计算引擎对数据流进行实时计算,之后将结果指标存放到高速的查询引擎中,从而达到秒级甚至毫秒级别的反馈。

       首先通过Flume实时采集数据,然后通过消息队列对采集的数据进行缓存,之后应用流式计算引擎实施计算,最后将计算的结果存储在高速的查询引擎中,以便后续高效地使用这些数据支持报表开发、多维分析或数据挖掘等。

5.2.2 流式计算实时统计GMV(Gross Merchandise Volume,成交总额)

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值