基于大数据平台的数据仓库


1、数据库(Database)
数据库是指将数据以一定的数据模型组织、描述和储存在一起的数据集合,具有尽可能小的冗余度、较高的数据独立性和易扩展性,且在一定范围内为多个用户共享

2、数据仓库(DataWarehouse)
数据仓库用于实现集成、稳定、反应历史变化、有组织有结构的数据集合,具有以下4个特点:
(1)面向主题
将企业各业务系统的数据进行综合归并,针对公司不同业务领域建立对应的主题。
比如在仓储系统中,计算货物的周转率,就需要统计货物进、出仓库的时间周期,此时就可以根据这一主题进行建模分析。
而在数据库里面强调的是一个完整的业务体系的数据整合,是面向事务处理不是面向分析

(2)集成的
企业有各种业务系统,比如OA系统、财务系统、人事系统、订单系统等,这些系统之间通常是独立的,如果站在公司层面,想看到公司的数据全貌,就需要对公司数据进行集成,同时保证数据的一致性、完整性、有效性、精确性

(3)稳定的
通常情况下数据库中是面向业务处理的,无法得到过去的状态信息,而数仓通常情况下要追踪历史、某一时刻的用户状态,从某个时间段来看是保持不变的,没有更新、删除操作,以查询分析为主

(4)变化的
数据仓库反映了数据的历史变化

3、数据仓库和数据库区别
在这里插入图片描述
OLTP (on-line transaction processing):
联机事务处理,主要是数据库中的业务数据,数据状态更新频繁,并发较高

OLAP (on-line analytical processing):
联机分析处理,主要是对数据仓库中的数据进行查询分析,很少涉及更新和删除

4、基于大数据平台的数据仓库技术栈
在这里插入图片描述
5、数据仓库的应用场景
在这里插入图片描述数据仓库为以下场景提供了坚实的数据管理基础:
数据分析、数据挖掘
人工智能、机器学习
风险控制、无人驾驶
数据化运营、精准运营
广告精准、智能投放

6、数据仓库建设的意义
在这里插入图片描述

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值