引言:
各位小伙伴们好,其实关于这几者的区别网上一直有非常多的资料,但据LZ观察这些资料非常粗糙且没有讲到其本 质和区别,干货很少十分杂乱对于一些小伙伴来说容易懵,于是想从自己的理解出发结合收集的一些有价值的资料进行一个整合。
希望这篇文章对你有所帮助。
数仓是什么?
数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策和全局信息共享。
所谓主题:是指用户使用数据仓库进行决策时所关心的重点方面,如:收入、客户、销售渠道等;
所谓面向主题,是指数据仓库内的信息是按主题进行组织的,而不是像业务支撑系统那样是按照业务功能进行组织的。
所谓集成:是指数据仓库中的信息不是从各个业务系统中简单抽取出来的,而是经过一系列加工、整理和汇总的过程,因此数据仓库中的信息是关于整个企业的一致的全局信息。
所谓随时间变化:是指数据仓库内的信息并不只是反映企业当前的状态,而是记录了从过去某一时点到当前各个阶段的信息。通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。
数据仓库的主题建模思想是:
面向主题:采用范式模型理论中的主题划分方法对业务数据进行分类。
一致性保证:采用维度模型理论中的总线结构思想,建立统一的一致性维度表和一致性事实表来保证一致性。
数据质量保证:无论范式建模还是维度建模都非常重视数据质量问题,综合使用两个理论中的方法保证数据质量。
效率保证:合理采取维度退化、变化维、增加冗余等方法,保证数据的计算和查询效率
数据仓库技术架构:
数据仓库功能架构:
数据中台是什么?
数据中台是数据服务工厂。
数据中台对于业务的价值是“加速从数据到价值的过程,提高企业的响应能力。
数据中台对是聚合和治理跨域数据,将数据抽象封装成服务,提供给前台以业务价值的逻辑概念。
数据中台是一种将企业沉睡的数据变成数据资产,持续使用数据、产生智能、为业务服务,从而实现数据价值变现的系统和机制。通过数据中台提供的方法和运行机制,形成汇聚整合、提纯加工、建模处理、算法学习,并以共享服务的方式将数据提供给业务使用,从而与业务联动。
再者,结合业务中台的数据生产能力,最终构建数据生产—消费—再生的闭环。
数据中台的优点和价值是什么?
数据中台不等于大数据平台,数据中台的核心工作也并不是将企业的数据全部收集起来做汇总就够了。数据中台的使命是利用大数据技术、通过全局规划来治理好企业的数据资产,让数据使用者能随时随地获取到可靠的数据。
因此,数据中台一旦建成并得以持续运营,其价值将随着时间的推移将呈指数级增长。数据中台的价值众多,下面详述其中的三大价值:
1. 帮助企业建立数据标准
在有数据中台之前,企业基本不会有全局的数据标准,即使有相关的数据标准,由于没有数据中台这个实体形态,数据标准也无从执行。数据中台的建设天然会帮助企业建设数据标准,包括数据建设规范和数据消费规范。
数据建设规范有诸如数据接入规范、数据建模规范、数据存储规范和数据安全规范等,数据消费规范包含数据权限规范、数据调用规范以及数据销毁规范等。这些标准都是建设数据中台时必须建立起来并依托数据中台去执行和落地的。
2. 促进中台组织形成<