商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具。商业智能一般由数据仓库、联机分析处理、数据挖掘、数据备份和恢复等部分组成。因此,把商业智能看成是一种解决方案应该比较恰当。商业智能的关键是从许多来自不同的企业运作系统的数据中提取出有用的数据并进行清理,以保证数据的正确性,然后经过抽取(Extraction)、转换(Transformation)和装载(Load),即ETL过程,合并到一个企业级的数据仓库里,从而得到企业数据的一个全局视图,在此基础上利用合适的查询和分析工具、数据挖掘工具、OLAP工具等对其进行分析和处理(这时信息变为辅助决策的知识),最后将知识呈现给管理者,为管理者的决策过程提供支持。
- OLAP工具。提供多维数据管理环境,其典型的应用是对商业问题的建模与商业数据分析。OLAP也被称为多维分析。主流的商业智能工具包括BO、COGNOS、BRIO。
- 数据挖掘(Data Mining)软件。使用诸如神经网络、规则归纳等技术,用来发现数据之间的关系,做出基于数据的推断。(需要加强)
- 数据仓库(Data Warehouse)和数据集市(Data Mart)产品。包括数据转换、管理和存取等方面的预配置软件,通常还包括一些业务模型,如财务分析模型。主要用到的工具如下,建模:ERWIN,Powerdesign;etl:informatica;
OLAP的目标是满足决策支持或者满足在多维环境下特定的查询和报表需求,它的技术核心是"维"这个概念。OLAP的基本多维分析操作有钻取(roll up和drill down)、切片(slice)和切块(dice)、以及旋转(pivot)、drill across、drill through等。OLAP有多种实现方法,根据存储数据的方式不同可以分为ROLAP、MOLAP、HOLAP。
- ROLAP表示基于关系数据库的OLAP实现(Relational OLAP)。多维数据库的多位结构划分为两类表:一类是事实表,用来存储事实数据和维关键字;另一类是维表,存放各种维度和维的层次信息。维表和事实表通过主关键字和外关键字联系在一起,形成了“星型模式”。(雪花模式)
- MOLAP表示基于多维数据组织的OLAP实现(MHOLAP表示基于混合数据组织的OLAP实现(Hybrid OLAP)。如低层是关系型的,高层是多维矩阵型的。ultidimensional OLAP)。以多维数据组织方式为核心,也就是说,MOLAP使用多维数组存储数据。多维数据在存储中将形成“立方块(Cube)”的结构。
- HOLAP表示基于混合数据组织的OLAP实现(Hybrid OLAP)。如低层是关系型的,高层是多维矩阵型的。
数据分析系统的总体架构分为四个部分:源系统、数据仓库、多维数据库、客户端。
- ·源系统:包括现有的所有OLTP系统,搭建BI系统并不需要更改现有系统。
- ·数据仓库:数据大集中,通过数据抽取,把数据从源系统源源不断地抽取出来,可能每天一次,或者每3个小时一次,当然是自动的。数据仓库依然建立在关系型数据库上,往往符合叫做“星型结构”的模型。
- 多维数据库:数据仓库的数据经过多维建模,形成了立方体结构。每一个立方体描述了一个业务主题,例如销售、库存或者财务。
- ·客户端:好的客户端软件可以把多维立方体中的信息丰富多彩地展现给用户。
商业智能项目的实施步骤:
(1)需求分析: 需求分析是商业智能实施的第一步, 在其他活动开展之前必须明确的定义企业对商业智能的期望和需求, 包括需要分析的主题, 各主题可能查看的角度(维度); 需要发现企业那些方面的规律. 用户的需求必须明确.
(2)数据仓库建模:通过对 企业需求的分析, 建立企业数据仓库的逻辑模型和物理模型,并规划好系统的应用架构,将企业各类数据按照分析主题进行组织和归类. (3) 数据抽取: 数据仓库建立后必须将数据从业务系统中抽取到数据仓库中, 在抽取的过程中还必须将数据进行转换, 清洗, 以适应分析的需要. (4) 建立商业智能分析报表: 商业智能分析报表需要专业人员按照用户制订的格式进行开发, 用户也可自行开发(开发方式简单,快捷) . (5) 用户培训和数据模拟测试: 对于开发—使用分离型的商业智能系统, 最终用户的使用是相当简单的, 只需要点击操作就可针对特定的商业问题进行分析. (6) 系统改进和完善: 任何系统的实施都必须是不断完善的. 商业智能系统更是如此, 在用户使用一段时间后可能会提出更多的,更具体的要求, 这时需要再按照上述步骤对系统进行重构或完善。
数据报表、数据分析、数据挖掘是BI的三个层面。