Kylin术语
Data Warehouse(数据仓库)
数据仓库是一个各种数据(包括历史数据和当前数据)的中心存储系统,是BI( business intelligence ,商业智能)的核心部件。
这里所谈的数据包括来自企业业务系统的订单、库存、交易账目、客户和供应商等来自企业所处行业和竞争对手的数据以及来自企业所处的其他外部环境中的各种数据。
Business Intelligence(商业智能)
商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。
为了将数据转化为知识,需要利用数据仓库、联机分析处理(OLAP)工具和数据挖掘等技术。
OLAP(online analytical processing)
OLAP(online analytical processing)是一种软件技术,它使分析人员能够迅速、一致、交互地从各个方面观察信息,以达到深入理解数据的目的。从各方面观察信息,也就是从不同的维度分析数据,因此OLAP也成为多维分析。
![eebfc6b3c2e23e55f97ae02998577287.png](https://i-blog.csdnimg.cn/blog_migrate/b5d8de844ffcf3ee454afab199a35d36.jpeg)
分析订单金额总和的规律,需要从不同的角度去观察
角度1:地区
角度2:品类
角度3:时间
角度4:地区,品类
角度5:地区,时间
角度6:品类,时间
角度7:地区,品类,时间
OLAP 类型
![ddc74f1baa256841a6a083972b9ac92b.png](https://i-blog.csdnimg.cn/blog_migrate/0cec9d1ed6d8eebe654cc7ca27878bc7.jpeg)
星型模式
星型模式是多维的数据关系,它由事实表(Fact Table)和维表(Dimension Table)组成。每个维表中都会有一个维作为主键,所有这些维的主键结合成事实表的主键。事实表的非主键属性称为事实,它们一般都是数值或其他可以进行计算的数据。
![dfc472b8a071513e2b57a3081ed3a7e8.png](https://i-blog.csdnimg.cn/blog_migrate/3cc28305539549b2ad0adc350cb5b525.jpeg)
![b47cf6a37bef83ceb6a3681c7a022ebe.png](https://i-blog.csdnimg.cn/blog_migrate/7ecacbe2a229d696292e0fe808a0570e.jpeg)
事实表(Fact Table)和维表(Dimension Table)
![20b6ba544a00a1acdef55ffe427bf4b5.png](https://i-blog.csdnimg.cn/blog_migrate/f6a99b72117a7510453d174b0a1992ee.jpeg)
Kylin的工作原理
Apache Kylin的工作原理本质上是MOLAP(Multidimensional Online Analytical Processing)Cube,也就是多维立方体分析。这是数据分析中相当经典的理论,在关系数据库年代就已经有了广泛的应用,下面将对其做简要介绍。
维度和度量简介
在说明MOLAP Cube之前需要先介绍一下维度(Dimension)和度量 (Measure)这两个概念。 简单来讲