1、数据仓库的特点
面向主题、集成、相对稳定、反映历史变化
2、OLAP基本概念
(1)“维” 是人们观察世界的角度
(2)OLAP基本多维分析
1)钻取 :改变维的层次,变换分析的粒度。包括rool up(上钻减少维度)和drill down(下钻增加维度)
2)切片和切块 :对维度的值进行限制,如果维度数为2则是切片,维度数为3则是切块
3)旋转 :旋转是变换维的方向,即在表格中重新安排维度的放置,例如行列转换
(3)OLAP 12条规则
3、Infoobject 信息对象
关键值:业务评价中的数值部分,用来存放要分析的数值。除了在数据库中的物理存储的关键值,还可以在业务浏览器里面派生关键值,派生的关键值经过计算得到
特性:业务评价中的评价对象,多是非数值型的内容,用来对数值进行界定。关键值只有与一系列特征相联系才有具体含义。
SAP特性分为以下类型:业务特性、单位、时间特性、技术特性
4、数据存储对象(DSO)
标准DSO
1)生成主数据标识 勾选可以提高报表查询性能,但是激活数据时需要花费较长时间,如果不需要从该DSO出报表可以不勾选。只有选中该选项,“惟一的数据记录”才能变为可用
2)惟一的数据记录 用于指定DSO对象是否只能装载惟一键值的数据记录,选中这一选项,意味着如果已经存在关键字字段的组合记录,那么就不可能把具有相同关键字段组合的数据装载到DSO对象中。反之,相同关键字段的数据记录会在激活的时候与原来的记录覆盖或者是汇总。覆盖还是汇总由转换规则决定。
3)自动将质量状态设置为正确 一般情况会选择这一选项,如果希望在数据装载到DSO后,人工对数据进行检查,可以不选中,只有手工设置为正确(绿色),才可以激活数据
4)自动激活数据存储对象数据 有处理链则不支持
5)自动从数据存储对象中更新数据 处理链不支持该选项
写优化DSO
只有一张激活数据表,数据进入DSO在报表层次就是可见的。这种类型的DSO在写入方面进行了性能优化,用于海量明细数据的快速收集.
特有设置选项:语义的数据存储键值不惟一,数据表的技术关键字段经常由数据请求标识、数据包和数据记录号组成。
- 数据进入DSO不产生主数据SID
- 每条数据记录的技术关键值是唯一的,所以只有插入操作,没有更新操作
- 基于数据请求ID进行分区
直接更新DSO
只有一张数据表,数据进入DSO后在报表层次是不可用的,它的数据不是通过数据传输过程进入DSO的,而是通过API函数直接写入DSO,也可以在分析设计器中使用DSO对象。
5、ETL (Extract Transform Load)抽取、转换、加载 ,ETL是数据仓库的核心和灵魂
7、数据传输进程提取模式
1)全量更新,可以设置包的大小,数据包大小在提取过程中对内存有间接的影响。
2)增量更新,“仅获取一次增量”,如果不设置,系统在下次增量传输时会自动将删除的数据再次进行传送,以保证数据的完整性。该标识设置后,源数据的增量数据只能传输一次。
8、se16 RSZGLOBV 后台变量表