一. 商业智能数据分析的基础
初识商业智能
何为商业智能(Business Intelligence)?
商业智能:基于客观数据,获得信息,辅助决策。
商业智能系统的五个层次:
1. 数据源层:文本文件、Excel、各类数据库……由于数据来源各式各样,很难直接用其做报表或分析。
2. 数据转换:将来源不一的数据进行提取,并转换成统一格式。
3. 数据存储与检索:转换后的数据存储在数据仓库中。数据集市:由于数据仓库任务繁重,有时会将相关主题的数据载入数据集市中(可以是RDBMS或OLAP数据库)
4. 数据分析:注意元数据的作用(将数据变为信息)。
5. 数据展现:有分析工作流图、交互式报表、仪表盘……
多维数据集
从数据到信息的转变
维度数据仓库
事实表、维度表、星型结构、雪花型结构、度量值组
度量值组(measure group)与一张事实表相似,但度量值组可以包含多个粒度的数据,而一张事实表只能是同粒度下的数据。
度量值和计算
多维数据集中的聚合函数
多维数据集中有以下4中函数类型:
- 累加性:求和
- 拟累加性:求最大、最小
- 半累加性:父级成员值等于子级成员值的总和,但在时间维度中除外。FirstChild函数 LastChild函数 FirstNoneEmpty、LastNoneEmpty
- 非累加性:非重复计数函数(DistinctCount)
累加性、拟累加性、半累加性 可以通过子级值来对父级值进行计算,因而查询速度较快。