大数据之数据仓库

最新推荐文章于 2024-02-17 12:31:40 发布

小蜗牛爱学习

最新推荐文章于 2024-02-17 12:31:40 发布

阅读量913

点赞数

分类专栏：大数据数据仓库文章标签：数据仓库大数据数据分析数据库 java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42755939/article/details/107507803

版权

数据仓库是面向分析的集成化数据环境，用于决策支持。它具有面向主题、集成、稳定和时变四大特征，与数据库的主要区别在于其设计目标和数据处理方式。数据仓库的分层架构包括源数据层、数据仓库层和数据应用层，通过ETL过程实现数据的抽取、转换和加载。分层有助于简化处理逻辑，提高效率。

摘要由CSDN通过智能技术生成

大数据之数据仓库

数据仓库

1、数据仓库的基本概念

数据仓库(Data Warehouse，可简写为DW或DWH)是用来构建面向分析的集成化数据环境，为企业提供决策支持(Decision Support)。它处于分析报告和决策支持目的而创建的。

数据仓库本身并不"生产"数据，同时也不"消费"任何数据，数据来源于外部供给外部使用，这也是为什么叫数据仓库，而不是工厂的原因。

2、数据仓库的四大特征

2.1、面向主题的

数据仓库是一般从用户实际需求出发，将不同平台的数据源按设定主题进行划分整合，与传统的面向事务的操作型数据库不同，具有较高的抽象性。面向主题的数据组织方式，就是在较高层次对分析对象数据的一个完整、统一并一致的描述，能完整及统一地刻画各个分析对象所涉及的有关企业的各项数据，以及数据之间的联系。

2.2、集成的

数据仓库中存储的数据大部分来源于传统的数据库，但并不是将原有数据简单的直接导入，而是需要进行预处理。这是因为事务型数据中的数据一般都是有噪声的、不完整的和数据形式不统一的。这些“脏数据”的直接导入将对在数据仓库基础上进行的数据挖掘造成混乱。“脏数据”在进入数据仓库之前必须经过抽取、清洗、转换才能生成从面向事务转而面向主题的数据集合。数据集成是数据仓库建设中最重要，也是最为复杂的一步。

2.3、稳定的

数仓的数据是记录已经发生的数据，并且是为决策提供依据的数据，是不允许进行修改的。即数据保存到数据仓库后&#

最低0.47元/天解锁文章

小蜗牛爱学习

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。