SuccezBI 笔记

转自:SuccezBI 笔记系列(一)


一、元数据管理:

所谓元数据指的就是描述数据的数据,例如数据库系统中描述表结构信息的数据就是数据库的元数据。
商务智能领域的“数据”往往指代的就是经过建模抽取后的多维模型数据库表,SuccezBI允许将这些数据库表将以元数据的形式进行加载,它们将形成事实表,维表等等元数据对象。

元数据项目是SuccezBI用来组织和管理各种元数据的容器。在元数据项目中:
1)数据模型目录下可以创建事实表,维表等数据模型元数据;
2)分析展现目录下可以创建报表,ActiveDoc,EasyQuery,Olap,门户等等分析展现元数据;
3)数据采集目录下可以创建采集表单等等元数据;
4)工作流程目录下可以创建流程定义等等元数据;

项目的数据源设置决定了项目内部元数据可以访问哪些数据库。

元数据复制将把选中的元数据完整复制为一份新的元数据到目标目录下,但不支持复制到当前目录下;
克隆元数据是SuccezBI提供的一种快速地产生元数据拷贝的功能,系统将选中元数据拷贝出一个新的元数据,并自动指定了一个合适的名称,例如“附件1_报表”;

元数据导出包是以.spk为后缀的,但实际上它是一个zip压缩包,通过常见的解压软件都可以将之解压查看结构。spk包的结构比较简单,它是按照被导出元数据的目录结构去组织的,每个元数据会对应spk中的一个文件,而每个目录也会对应spk中的一个目录。

除了导入spk包外,元数据导入功能还允许导入任意类型的文件,这些文件导入到系统后将成为文件类型的元数据,您可以像其它元数据一样在系统中对之进行各种操作。

SuccezBI中的元数据存在星型模型 雪花模型各种各样的关联关系,例如事实表支持关联维表组成 ,而维表也支持关联其它维表组成。报表支持引用事实表,维表作为自己的数据源,而ActiveDoc也支持引用报表作为自己的表格,统计图的数据来源。元数据系统提供了对这些复杂的关联关系的统一管理,通过这些关联关系用户可以去了解一个元数据的内容会影响到哪些元数据,这就是元数据的影响分析 。

与元数据影响分析 一样,元数据的血统分析获取的是元数据关联关系体现的数据来源信息。例如报表的数据来源于事实表,维表,那么分析一个报表元数据的血统时,便能够将这个报表的所有数据来源事实表,维表列举出来。

项目备份时就有通过勾选框选择是否备份业务数据,以及是否备份视图表。所谓业务数据就是事实表,维表等数据模型对应的数据库表,通常情况下您并不需要备份业务数据,因为业务数据的数据量往往很大。但如果相应的业务数据量合适,且您希望将项目恢复到一个新的服务器中即时可用,可以选择备份业务数据。

元数据系统将在默认数据源中创建和维护自己的存储结构。 SuccezBI需要通过默认数据源存储自身的元数据,因此在系统安装部署时需要指定一个默认的数据源配置。

二、数据源管理

默认数据源中除了存储系统表外,也可以用于存储业务表,但通常情况下建议在项目实施时默认数据源保持单纯,这样既可以提升业务表的分析性能,又能够使得整个存储结构更加清晰。

系统在第一次启动初始化后,将在默认数据源中创建一批用于元数据存储的数据库表,这些数据库表将以“SZSYS_”开头,它们即是SuccezBI的系统表。

系统安装部署过程中设置好的默认数据源配置将被存储到工作目录下的jdbc.conf文件,您可以手工调整这个这个文件来修改默认数据源的配置。当 工作目录工作目录下已有jdbc.conf时,系统将忽略系统初始化向导过程直接启动,因此对于高级用户来说,直接配置好工作目录和jdbc.conf能够简化安装 系统初始化向导部署过程。

导入方式
如果导入的数据库表在数据库中不存在,那么直接导入。如果导入的数据库表在数据库表中已经存在了,此时支持下面三种导入方式:
1)创建表:在数据库中自动设置新表名创建新表。即在当前表名后面自动增加一个随机字符串构建一个新表名;
2)覆盖表:删除已存在的表,然后重建;
3)清空表:先清空已存在的表的数据,然后将导入表的数据重新写入已存在的数据库表中,此时不允许增加字段;

选择编码的编码配对原则
由于导入是会选择编码,如gbk或者utf-8,所以导入的时候需要对应,例如导出时设置的gbk的编码,此时也需要通过gbk编码导入数据库表。如果 导出不选择对应的编码会导致导入的数据乱码。

SuccezBI支持数据源url参数中可以使用常量default-datasource-address,表示默认数据源的数据库服务器ip地址,每次在变更部署服务器或将SuccezBI备份恢复到其他服务器时,只需要更改默认数据源的url地址即可,这样就可以在任意的机器上部署了。

三、数据仓库建模:

事实表(Fact Table)是数据仓库的最重要组成部分,它一般包括若干个维键和若干个度量。
事实表的度量,是在多维数据集中可以用数据表达的某种系统指标,一般都是数值或其他可以进行计算的数据;
事实表的维键,是分析的维度,表示对度量(指标)要从哪些方面来分析,是指分析问题的角度。一般都是文字、时间等类型的数据;

维表(Dimension Table)是数据仓库中存放维键所有属性所有取值的数据库表。

星型模式是一种多维的数据关系,它由一个事实表和一组维表组成。每个维表都有一个维代码作为主键,所有这些维键则组合成事实表的主键。

在SuccezBI系统中,根据组成内容的不同,共分为了四种维:
1)单级维:该维表没有层次,只有一级;

2)代码分段维:一个字段的数据可以分成几段,每段都有其业务意义;
例如行政区划码为:420101(江岸区)。第一段42表示湖北省,第二段01表示武汉市,第三段01表示武汉市下的江汉区:
其中分段属性:2-2-2 分段描述:省-市-区
当然也存在某些特殊情况,可能有维度有一个全部为0的根节点,如:维度的根节点为000000,那么其分段应该设置为0-2-2-2

3)层次维:根据所选择的字段组合构建层次,维表树形结构显示是根据设置的层次路径来显示,如如行业类别维的层次路径为:大类、中类、小类

4)父子维:两个字段之间有父子关系,一个字段表示父节点,一个字段表示子节点,系统增加了一个(levelid_)字段,自动给父子维编码,生成分段层次。
例如地区:中国-湖北、湖北-武汉、武汉-江汉区、湖北-荆州;会根据形如这样的数据构造树形。
当选中为父子维时,需要设置的属性:
父字段:指定父子维中的父字段,该字段不能为空
子字段 :指定父子维中子字段,如果不指定,默认使用维键作为子字段

事实表的名称是必填项,它是事实表的业务名称,名称将在当前目录下唯一标识一个事实表,事实表名称建议使用纯英文,数字和下划线组成,并确保第一个字母不是数字,例如“FA_XS_DAY ”,“ FT_JXC_MONTH”等。

事实表标题将在元数据列表,以及各种资源选择器界面中呈现,相比名称,标题可以更加灵活地去设置,为事实表取一个贴切的标题将有助于用户理解这个事实表用途,例如“月销汇总表”,“销售信息表”等等

事实表本质上是对这些数据库表的业务层包装,事实表可以关联数据库表进而对数据库表的字段进行重新包装和建模,方便分析展现工具进行数据分析。

事实表一般是随时间变化的,如一月变化一次或一年变化一次等,也可能是缓慢变化的。事实表中的数据期是用来提供给数据分析展现工具(如表 EasyQuery功能等)用的。如果没有设置数据期,那么分析展现工具就无法知道事实表的数据期字段了,此时就无法通过设置年月日等来过滤数据等,也无法使用系统变量$t,同比、环比等表达式来分析数据了。

周期相对固定的,如年、 月、日等固定的周期,如201301,201302,201303(以一个月为一个周期)。设置固定周期数据期后,需要指定固定周期字段,该字段还需要对应一个数据期维表。
周期不是固定的,是有起止时间的,如2013030120130305(这个周期有5天),2013030620130320 。设置数据期为缓慢变化后 (这个周期有15天),需要设置有效期起、有效期止字段。

只有设置数据期为固定周期后,才能使用同比、环比等统计函数;

当查询此事实表的数据时总是会使用“基本属性”这里指定的过滤条件过滤数据,此设置往往用于过滤一些总是不会被使用的数据。

维键度量编辑:
表达式:在虚拟度量维键中通过表达式来将一个或者多个度量维键(也可以引用其他事实表或者维表中的数据)的数据计算并融合在一个字段中供分析展现工具使用。可以弹出表达式编辑器来方便的编辑表达式。

维键度量显示规则
度量:没有表达式,没有关联维表,维度是不能勾选的
维键:没有表达式,维度是必须勾选的
虚拟度量:没有字段名,没有关联维表,维度是不能勾选的
虚拟维键:没有字段名,维度是必须勾选的
总之,度量维键是通过维度是否勾选来切换的,维键度量只有字段名没有表达式,虚拟维键度量只有表达式没有字段名。

进入维表数据编辑页面查看维表数据 文本区域分为两部分:
文本区域中的第一行:列出了维表对应数据库物理表的字段信息,例如:DL(C|2),表示第一列字段名是DL,类型是字符型,长度为2;
文本区域中的第二行至最后一行:每一行对应数据库物理表中的一行数据;
添加维表数据有两种方式:
方式一:直接在文本区域中添加,数据之间以tab键隔开
方式二:将相邻数据写在excel相邻列中,再将其数据复制粘贴到文本区域中即可(原理:excel相邻列就相当于一个tab键)。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值