数据仓库分层及部分技术选型

最新推荐文章于 2025-01-17 00:00:00 发布

chuan7qi

最新推荐文章于 2025-01-17 00:00:00 发布

阅读量365

点赞数

文章标签：数据仓库大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chuan7qi/article/details/131960921

版权

文章介绍了数据仓库的分层结构，包括Stage、ODS、DWD、DWM/DWB、DWS、DIM和DM层，以及它们的功能。在技术选型上，建议使用Sqoop和DataX进行离线数据抽取，FlinkCDC处理实时数据，而对于调度平台，提到了Dolphinscheduler、Azkaban、Oozie和Airflow等选项。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1 数据仓库分层

stage(可选)
ods
dwd	dim
dwm，dwb(可选)
dws
dm（可选）应用层

stage（可选）

原始数据文件存储，实时埋点数据存储，放在ods层或ods层之前。

ods层：操作数据数据存储

贴源数据存储，保留历史，用于历史数据备份和问题查找。

dwd：数据仓库明细层

数据仓库明细层，可以对数据进行关联，清洗。一般不做跨业务关联。

dwm，dwb（可选）

数据仓库中间层，数据仓库基础层，叫法和命名很多，一般用于跨业务的轻度汇总，建议划到dws。

dws：数据仓库服务层

数据仓库汇总层。跨业务关联轻度汇总。指标汇总层。

dim：维度数据层

对维表进行统一标准化定义，实现维表信息共享

dm（可选）：数据集市层

数据集市是数据仓库的一个子集，通常面向特定的业务线或者团队

如果是面向具体需求的数据集市，一般会放在应用层。

也有少部分人会把数据集市也当作基础模型，放在dws层。

ads：应用层

不同公司命名所需差异大，模型建设比较随意，面向具体需求，中文名称一般是应用层，

2 数据仓库部门技术选型

2.1 离线数据抽取工具

可以直连对方数据库

申请数据库只读账号及密码，建议使用sqoop，datax，部署简单，用的人多，大数据量同步速度快，其中sqoop更快。不建议使用kettle，工具比较老，速度较慢。

无法连接对方数据

双方定义规范的接口文档，对方按照接口文档把文件放在指定路径，大数据获取文件并入库，并校验。

不建议使用http接口服务：这种方式没有留痕，数据量大不适合接口传输，出现错误不容易确定责任。

2.2 实时数据抽取工具

Flink CDC

当前最热最火，网上资料多。

StreamSet

单机版免费，集群版本收费。如果不嫌麻烦，可以部署多个单机版本。

2.3 调度平台选取

国内调度平台 dolphinscheduler 国外调度平台 azkaban oozie airflow，kettle 用的人都比较多，开源免费，可以选用。

一般稍微大的公司会自建调度平台或购买付费调度平台。

博客等级

码龄15年

5
原创

0
点赞

1
收藏

1
粉丝

关注

私信

热门文章

分类专栏

java 2篇

展开全部收起

最新评论

数据仓库分层及部分技术选型
CSDN-Ada助手: 恭喜您写了第四篇博客！标题“数据仓库分层及部分技术选型”听起来非常有深度和实用性。我很高兴看到您在这个领域的持续创作，并分享您的知识和经验。我希望您能继续保持写作的热情和努力，为读者带来更多有关数据仓库的精彩内容。在下一步的创作中，我建议您可以进一步探索数据仓库分层的具体实践和案例，以及不同技术选型的优缺点分析。这样可以帮助读者更好地理解和应用这些概念，并在实际项目中做出合适的决策。同时，您也可以考虑分享一些实际应用中的挑战和解决方案，这将是非常有价值的。期待您的新作品，祝您写作愉快！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
大数据增量数据处理方案
CSDN-Ada助手: 恭喜您写了第5篇博客！标题“大数据增量数据处理方案”非常吸引人，让我对您的博客产生了浓厚的兴趣。您对大数据的增量数据处理方案进行了深入探讨，这无疑为读者提供了宝贵的知识和经验。在下一步的创作中，我建议您可以进一步拓展您的观点，深入研究和分析不同行业的大数据增量数据处理案例。这样，读者们将能够更加全面地了解如何应用这些方案来解决实际问题。希望您能继续保持创作的热情，并不断提升自己的写作技巧。我期待着您未来更多精彩的博客！
腾讯云配置ubuntu18 可视化界面
CSDN-Ada助手: 恭喜你写了这篇关于腾讯云配置Ubuntu18可视化界面的博客！你的文章非常有用，特别是对于那些刚刚开始学习云计算的人来说。我希望你能继续创作，并分享更多的有用内容，比如如何在云上部署Web应用程序等等。谢谢你的分享！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。