大数据面试通关手册 | 数据仓库体系建模&实施&注意事项面试题

数据仓库是用于分析处理的数据集合,与业务数据库主要区别在于其面向分析而非事务处理。本文探讨了数据仓库与数据库的区别、OLAP与OLTP的概念,以及数仓的演变与现代实践。在面试中,常见的问题包括数仓特点、OLAP与OLTP的区别、数据建模等。随着大数据技术的发展,数仓建模不再严格遵循传统规则,分层架构变得灵活。面试时,除基础问题外,还会涉及指标体系、数据质量、维度建模和数仓分层等。指标字典是指标管理的关键,确保口径统一。此外,日期维度是常用维度,需要初始化和维护。数据治理和增量同步也是重要话题,增量同步涉及全量初始化、数据变更追踪和拉链表等策略。
摘要由CSDN通过智能技术生成

什么是数仓

从字面上来看,数据仓库就是一个存放数据的仓库,它里面存放了各种各样的数据,而这些数据需要按照一些结构、规则来组织和存放。这里我们会遇到一个问题就是同样是存放数据的仓库,那数据库和数据仓库是一样的吗?

数据库 VS 数据仓库

数据库就是我们常用的关系型数据库(MySQL、Oracle、PostgreSQL...),还有什么非关系型数据库,它主要存放业务数据,那数据仓库有有些什么数据呢?说到他们的区别,我们一般会提到OLTP和OLAP。

  • OLTP:on-line transaction processing,联机事务处理,主要是业务数据,需要考虑高并发、考虑事务

  • OLAP:On-Line Analytical Processing,联机分析处理,重点主要是面向分析,会产生大量的查询,一般很少涉及增删改

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

王知无(import_bigdata)

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值