数据仓库 迁移 大数据_从数据仓库迁移到大数据平台的最佳实践

本文探讨了从数据仓库迁移到Hadoop/大数据平台的常见起点,即卸载冷数据和ETL工作负载。重点介绍了数据摄取、集成和交付的关键考虑因素,以及MapR平台在简化数据处理中的作用。迁移后的益处包括成本节省、性能提升和新的分析能力,为企业带来业务洞察和效率提升。
摘要由CSDN通过智能技术生成

数据仓库 迁移 大数据

对于企业开始大数据之旅而言,将冷的或未使用的数据和ETL工作负载从数据仓库卸载到Hadoop /大数据平台是一个非常普遍的起点。 像Hadoop这样的平台提供了一种经济的方式来存储数据并进行大数据集的批量处理。 因此,成本是此初始用例的主要驱动力就不足为奇了。

这些项目在实际实施时会是什么样? 在本文中,我们将研究需要考虑的不同因素,我们将提供一种实现数据仓库卸载的方法,并演示事物如何在Hadoop /大数据世界中转换。 在传统的数据仓库世界中,人们非常习惯于对任务和工作流程进行排序。 数据必须从源系统中提取,转换,然后加载到目标(即数据仓库)中。

在传统的数据仓库世界中,结构和架构至关重要,这导致了明确定义的转换。 在Hadoop和大数据世界中,无需将数据存储为结构化格式。 新工具可以在没有模式的情况下工作,或者在读取时应用模式,或者针对列,键值对和文档数据库进行优化。 没有真正的提取和加载-都是关于数据到达集群后发生的转换。 从数据仓库卸载时,将同时移动数据和转换。 数据生命周期

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值