数据仓库迁移大数据_从数据仓库迁移到大数据平台的最佳实践

最新推荐文章于 2023-12-25 00:39:35 发布

danpu0978

最新推荐文章于 2023-12-25 00:39:35 发布

阅读量1.1k

点赞数 1

文章标签：数据仓库大数据 python java 人工智能

原文链接：https://www.javacodegeeks.com/2016/10/best-practices-migrating-data-warehouse-big-data-platform.html

版权

本文探讨了从数据仓库迁移到Hadoop/大数据平台的常见起点，即卸载冷数据和ETL工作负载。重点介绍了数据摄取、集成和交付的关键考虑因素，以及MapR平台在简化数据处理中的作用。迁移后的益处包括成本节省、性能提升和新的分析能力，为企业带来业务洞察和效率提升。

摘要由CSDN通过智能技术生成

数据仓库迁移大数据

对于企业开始大数据之旅而言，将冷的或未使用的数据和ETL工作负载从数据仓库卸载到Hadoop /大数据平台是一个非常普遍的起点。像Hadoop这样的平台提供了一种经济的方式来存储数据并进行大数据集的批量处理。因此，成本是此初始用例的主要驱动力就不足为奇了。

这些项目在实际实施时会是什么样？在本文中，我们将研究需要考虑的不同因素，我们将提供一种实现数据仓库卸载的方法，并演示事物如何在Hadoop /大数据世界中转换。在传统的数据仓库世界中，人们非常习惯于对任务和工作流程进行排序。数据必须从源系统中提取，转换，然后加载到目标（即数据仓库）中。

在传统的数据仓库世界中，结构和架构至关重要，这导致了明确定义的转换。在Hadoop和大数据世界中，无需将数据存储为结构化格式。新工具可以在没有模式的情况下工作，或者在读取时应用模式，或者针对列，键值对和文档数据库进行优化。没有真正的提取和加载-都是关于数据到达集群后发生的转换。从数据仓库卸载时，将同时移动数据和转换。 数据生命周期

最低0.47元/天解锁文章

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。