数据仓库专题(3)-分布式数据仓库事实表设计思考

一、前言

  最近在设计数据仓库的数据逻辑模型,考虑到海量数据存储在分布式数据仓库中的技术架构模式,需要针对传统的面相关系型数据仓库的数据存储模型进行技术改造。设计出一套真正适合分布式数据仓库的数据存储模型。

二、事实表设计基础

      事实表记录发生在现实世界中的操作型事件,其所产生的可度数值。事实表的设计完全依赖于物理活动,不受可能产生的最终报表的影响。事实表中,除数字度量外,事实表总是包含外键,用于关联与之相关的维度,也可以包含退化的维度键日期/时间戳

三、传统模式

  以FS-LDM数据存储模型Event主题域数据存储模型设计为例,其事件主题域数据逻辑模型结构如下图所示:

   传统模式的主要问题如下:如果数据量很小的情况下,执行多表关联,没有问题,但是当在分布式数据仓库,单表存储海量数据的情况下,很明显模式将面临挑战。

三、分布式模式-维度建模新原则

  (1)以值代键:针对键值唯一的维表,除非必要,否则不引入维表,如IP地址维表,采用IP作为维表的主键,事实表中存储IP值;

      (2)合理分表:传统关系型数据仓库存在多表整合的冲动,如上图Event事实表,各种Acount Ind,Finance Ind等,用来扩展表的通用性,试图把所有的数据都存储到一张表 中。分布式数据仓库的设计,恰恰相反,因为单表数据规模的问题,如果要满足分析和处理的性能,合理的按照业务进行数据的分表存储。如财务相关事件、账户相关事件,单独成表。更有利于数据的计算和分析。 

四、分布式维度模型实例

序号字段英文字段中文字段解释字段映射字段加工逻辑指标字段
1event_id事件ID记录标识  标识
2tm时间时间戳  维度
3domain   维度-值
4ipIP地址IP地址  维度-值
5os操作系统操作系统  维度-值
6user_id用户ID用户ID  维度-FK
7date日期日期(新增)  维度-值
8from来源访问来源系统  维度-值

 五、未完待续

       分布式数据仓库数据存储模型设计进行中,后续会持续更新,请关注QQ群:分布式数据仓库建模 398419457。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
随着工业自动化程度不断提高,分布式控制系统已经日益成为一种趋势。而分布式数据采集系统作为工业自动化控制系统的重要组成部分,更是受到了广泛关注。基于STM32单片机的RS485总线分布式数据采集系统设计是目前较为流行和实用的一种方案。 首先,采用STM32单片机作为系统的核心控制芯片,这是因为其性能稳定、可靠、易于开发以及强大的性价比。RS485总线则作为系统的通信方式,可以通过多个采集点实现数据之间的共享和交换。同时,采用分布式设计方案可以使系统更加灵活和扩展性强,能够适应不断变化的需求。 其次,在系统的设计中,需要充分考虑到采集点的数据量、采样频率、通信速度等方面的因素。同时,为了保证系统的实时性和稳定性,需要进行合理的硬件和软件设计。比如,采用双缓冲区的数据收发方式,使用中断控制数据的收发,以及进行低功耗、低噪声设计等等。 最后,为了保证系统的性能和可靠性,需要对整个系统进行全面测试和优化。可以通过性能测试、功能测试和可靠性测试等方式来确保系统的稳定性和安全性。 总之,基于STM32单片机的RS485总线分布式数据采集系统设计是一项技术含量高的工作,需要多方面知识和经验的综合应用。但是,只要充分考虑所有因素,并进行精心设计和测试,就能够实现一个高效、稳定且扩展性强的分布式数据采集系统。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值