来电科技:基于Flink+Hologres的实时数仓演进之路

来电科技通过Flink+Hologres构建的实时数仓,实现了数据集成、开发、服务和应用的统一,提升了数据时效性和服务性能。企业业务对数据的需求包括实时大屏、统一数据服务和实时数仓。Flink提供了实时计算能力,Hologres实现了高并发读写和交互式分析。未来规划涉及流批一体和实时数仓完善。
摘要由CSDN通过智能技术生成

本文将会讲述共享充电宝开创企业来电科技如何基于Flink+Hologres构建统一数据服务加速的实时数仓

作者:陈健新,来电科技数据仓库开发工程师,目前专注于负责来电科技大数据平台离线和实时架构的整合。

深圳来电科技有限公司(以下简称“来电科技”)是共享充电宝行业开创企业,主要业务覆盖充电宝自助租赁、定制商场导航机开发、广告展示设备及广告传播等服务。来电科技拥有业内立体化产品线,大中小机柜以及桌面型,目前全国超过90%的城市实现业务服务落地,注册用户超2亿人,实现全场景用户需求。

一、大数据平台介绍

(一)发展历程

来电科技大数据平台的发展历程主要分为以下三个阶段:
1.离散0.X Greenplum
为什么说离散?因为之前没有一个统一的大数据平台来支持数据服务,而是由每个业务开发线自行取数或者做一些计算,并用一个低配版的Greenplum离线服务来维持日常的数据需求。
2.离线1.0 EMR
之后架构升级为离线1.0 EMR,这里的EMR指的是阿里云由大数据组成的弹性分布式混合集群服务,包括Hadoop、HiveSpark离线计算等常见组件。
阿里云EMR主要解决我们三个痛点:一是存储计算资源的水平可扩展;二是解决了前面各个业务线异构数据带来的开发维护问题,由平台统一清洗入仓;三是我们可以建立自己的数仓分层体系,划分一个主题域,为我们的指标系统打好基础。
3.实时、统一 2.0 Flink+Hologres
当前正经历的“Flink+Hologres”实时数仓,这也是本文分享的核心。它为我们大数据平台带来了两个质的改变,一是实时计算,二是统一数据服务。基于这两点,我们加速知识数据探索,促进业务快速发展。

(二)平台能力

总的概括来说,2.0版本的大数据平台提供了以下能力:
1)数据集成
平台现在支持使用实时或者离线的方式集成业务数据库或业务数据的日志。
2)数据开发
平台现已支持基于Spark的离线计算以及基于Flink的实时计算。
3)数据服务
数据服务主要由两部分组成:一部分是由Impala提供的分析服务和即席分析的能力,另一部分是Hologres提供的针对业务数据的交互式分析能力。
4)数据应用
同时平台可以直接对接常见的BI工具,业务系统也能快速地集成对接。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值