【数仓】大数据领域建模综述-《大数据之路》读书笔记

  今天继续学习《大数据之路》。从今天开始,进入了本书的第2篇-数据模型篇。第1篇数据技术篇比较偏向于底层的技术实现,文章都已经更新完毕,可以点击下方的连接获取。从第2篇开始,着重数据的建模和维度设计等知识,这是数据仓库面试的重点。今天先学习第8章大数据领域建模综述。关注公众号回复 802 获取《大数据之路》pdf。
其他章节的文章请点击这里查看。

1.为什么需要数据建模

数据模型就是数据组织和存储方法,强调从业务、数据存取和使用角度合理存储数据。有了适合业务和基础数据存储环境的模型,会带来如下好处:

  • 性能:好的数据模型查询效率高,减少 IO 吞吐;
  • 成本:好的数据模型极大减少不必要的数据冗余,实现计算结果复用,降低存储和计算成本;
  • 效率:好的数据模型极大改善用户使用数据的体验,提高数据使用的效率;
  • 质量:好的数据模型能改善数据统计口径的不一致性,减少数据计算错误的可能性。
2.关系数据库系统和数据仓库

大数据仍然在 SQL 进行数据加工和处理,仍然在用 Table 存储数据,仍然在使用关系理论描述数据之间的关系。只是在大数据领域,基于数据存取的特点在关系数据模型的范式上有了不同的选择。

3.从 OLTP 和 OLAP 系统的区别看模型方法论的选择
  • OLTP 系统通常面向随机读写,3NF 的实体关系模型存储,在事务处理中解决数据的
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值