数据集成解决方案

一 . 业务背景

随着云计算的普及和大数据时代的到来,如何让各种数据源中的种类丰富的数据高效上云,以及经过云上大数据计算后,如何把计算结果回流到种类丰富数据源 ?或者云上各个产品之间的数据怎么进行同步 ? 各个云厂商或者大数据解决方案提供商都推出了各自的数据集成产品,本文将就常见的解决方案进行探讨。
典型的大数据业务集成场景

典型的大数据业务集成场景

二. 数据集成需要解决的问题

数据集成的本质是实现不同数据源之间的数据交换,并且在交换过程中具备数据清洗转换的能力;当然,在实际应用场景中,还需要解决各种复杂网络问题,例如用户本地机房如何进行数据上云,云上不同VPC 内的数据源如何进行相互同步等。
一个商业数据集成产品通常需要具备以下功能:
 1)支持种类丰富的数据源,并具备数据源的元数据管理
 2)具备数据源的全量抽取和增量抽取能力,并且稳定高效
 3)具备可视化的转换清洗能力
 4)具备数据质量监控能力,能收集脏数据并对同步的数据做质量校验
 5)完善的运维体系
 6)开放性,方便第三方扩张数据源
 7)系统水平扩展能力

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值