数据仓库
整合业务数据、系统日志数据、人员数据等企业全量数据的战略集合,数据集合是规范化、标准化的,数据分析、页面展示等使用数据时不用再次加工直接使用的数据。一般分为四层:ODS源层、DW数仓层、DM集市层、APP应用层。
数据湖
数据湖是集中的存储库,可以存储结构化数据和非结构化数据,如:数据表、JSON、图片、影音等。数据从各源头未经处理流入数据湖,在使用数据的时候才开始处理数据,说白了就是一个ODS层。在此之上开发API接口供用户分析、驱动业务。
数据中台
数据中台是一套可持续让数据用起来的机制,依据特有的业务场景和组织架构把数据变为资产并服务于业务的机制。使用数据直接驱动业务,业务反哺数据,不断循环迭代,实现数据可见、可用、可运营。
对比
数据仓库 | 数据湖 | 数据中台 | |
---|---|---|---|
分析 | 更多的用于分析报表 | 用户分析 | 可用于数据分析 |
业务 | 少量的应用直接服务于业务 | 少量使用,但最终还是为了业务 | 主要驱动业务,围绕直接驱动业务展开 |
技能 | 要求较低,会一些基本打数据处理技术,会写SQL即可建立 | 要求较高,需要编写API接口混合结构与非结构数据 | 底层主要偏数据处理,实时数据偏多,需要一部分接口供业务系统使用 |