mysql 多维数据集_BI笔记之---增量方式处理多维数据集

本文介绍如何在数据仓库系统中,使用MySQL处理多维数据集,特别是增量更新的方法。通过建立用户、产品和订单表,模拟数据仓库,使用SSIS和SSAS进行数据处理和多维数据集构建。增量处理通过将事实数据分为历史表和增量表,确保数据仓库的高效更新。文中还展示了SSIS包的构建过程,包括数据流、维度处理和cube处理,确保在业务系统无操作时执行,避免数据遗漏。
摘要由CSDN通过智能技术生成

本文将模拟一个数据仓库系统,其中有用户数据,产品数据以及订单数据。根据这些数据结构建立多维数据集,并且以增量更新的方式对其进行处理。之所以强调增量的方

本文将模拟一个数据仓库系统,其中有用户数据,产品数据以及订单数据。根据这些数据结构建立多维数据集,并且以增量更新的方式对其进行处理。

之所以强调增量的方式,是考虑到事实表中数据的增长,假设以后增长到几十亿,全量处理就变得很不现实,所以方案中着重演示以增量方式处理多维数据集的方案。

增量处理多维数据集的关键是要将事实数据分为两部分处理,一个是增量事实表,一个是历史事实表,多维数据集第一次处理历史事实表中的数据,以后每次周期性的处理都是处理增量表中的数据。

本文中提及的SQLServer和Visual Studio都是2008版本,2005版本同样也适用。

数据假设:一张用户表,一张产品表,一张订单表,订单里记录的是谁买了什么。多维数据集统计的需求就是根据订单统计谁买过什么。

首先,建立数据仓库,在数据引擎下新建BIDemo库。

c7a3f272d71f8f1c6703d36f8c9d9e5f.png

接下来建立用户表,结构如下:

此外还有产品表:

以及历史订单表和建立增量订单表,它们的结构是一样的:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值