一、数据的价值与时间
数据的时效在无人驾驶、外卖、打车、重点设备的故障告警等场景下十分重要。在这样的场景下,数据的价值随时间的流逝呈现急速下降。
图:价值随着时间呈指数下降
实时即未来
二、离线计算&实时计算
现实工作中80%的计算都是离线的,并不是实时计算不好,而是要实现实时计算更加的困难。
1.流式计算的翘楚flink、kafka等技术成熟度不高,在技术层面实现实时计算的难度大。
2.实时计算应用场景要求高、挑战大、不能有丝毫的差错;而离线计算更成熟,成本低,应用场景挑战也低。
3.实时计算技术大多用于不得不使用的场景:比如美团外卖,需要及时同步商家、骑手、用户的地理位置等信息、以及人工智能领域的智慧城市、智慧园区、智慧工厂等。
三、Lambda架构与Kappa架构
流式计算与批处理(离线计算)相结合的两种架构
1.Lambda架构
流式计算特点:通过kafka消息队列将大量的数据收集进来,并临时的存放,用完就丢弃,这样只能做出及时响应,不能访问历史数据进行分析。
Lambda架构将源数据镜像