数据库与数据仓库

数据仓库是用于分析处理的历史数据集合,其特点是面向主题、集成异构数据且以读为主。建立数仓旨在支持复杂查询和业务决策。维度建模包括星型和雪花模型,整体架构涉及Mysql、Hive等不同技术框架,适用于不同规模和性能需求。
摘要由CSDN通过智能技术生成

数据仓库是不是数据仓库?

关系型数据库(Mysql,Oracle等)按用途来划分,可以归为两种:

  1. 业务型数据库:用于日常的业务数据的CRUD,而且事务型操作比较多.
  2. 分析型数据库:用于历史数据分析,大部分的操作都是读数据.而事务性操作很少(因为历史数据大部分都是读)
    前者叫作数据库(用于业务处理),后者叫作数据仓库(用于分析处理)

数据仓库的特点

  1. 面向主题(维度设计).
  2. 数据源是异构的,集成的.所以数据仓库的数据规模要远远大于数据库.
  3. 数据仓库里的数据一般都是历史数据.
  4. 数据仓库操作数据的特点:大多数为读,即查询分析.
  5. 数据仓库查询分析数据时,一般都带有时间维度的
    在这里插入图片描述
    在这里插入图片描述

为什么要建立数仓?

比如我们查询每一个月的PV,UV量是多少,这种查询,完全可以从业务数据库来查询得到.
但是面对复杂或细粒度查询时,比如:2-~30岁女性用户过去五年的第一季度化妆品类商品的购买行衣与公司进行的促销活动方案之间的关系.
这种查询就需要从数据仓库里查询得到.
建立数据仓库的目的是为了更好的查询和分析业务数据.从而为公司的决策提供有力的支撑.

数据仓库的维度建模

所谓的维度建模,指的是围绕一张事实表,拆分为多张维度表,通过外键关联起来.维度建模有两种模型:

  1. 星型图模型
    各维度表
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值