1. 数据实时抓取
OLTP 中的操作数据可通过 CDC 工具实时同步到数据仓库中进行处理, 其作为数据实时处理的基础。
2. 数据实时计算
数据导入后以微批次或流计算的方式在秒级或毫秒级延迟内被处理, 计算结果往往作为增量数据与历史计算结果进行汇总, 而后将计算结果进行缓存以备服务层使用。
3. 数据实时展示
实时从服务层数据缓存中提取出最新计算结果并展示给用户, 仪表盘是常见的一种方式。
4. 数据具备一定的时效性
某些业务场景中, 实时生成的操作数据需要在限制时间内到达计算层并得到处理, 具备一定的时效性需求。
5. 系统监控管理功能
在实时计算架构中, 我们需要随时关注系统稳定性问题, 比如在数据实时抓取阶段是否有数据丢失, 数据延迟是否在可接受范围之内, 数据传输流量是否处在系统可承受范围内等等, 诸如此类的问题发现和解决有赖于完善的系统监控管理模块构建。