DataPipeline丨新型企业数据融合平台的探索与实践

本文介绍了数据融合平台的重要性和挑战,重点探讨了DataPipeline的架构,利用Kafka Connect实现数据同步,并讨论了如何通过消息队列解决数据一致性、扩展性和解耦问题。同时,提出了在数据一致性方面的一系列解决方案。
摘要由CSDN通过智能技术生成

文 |刘瀚林 DataPipeline后端研发负责人

在这里插入图片描述
一、关于数据融合和企业数据融合平台

数据融合是把不同来源、格式、特点性质的数据在逻辑上或物理上有机地集中,从而为企业提供全面的数据共享。

企业数据融合平台,通常的表现形态为运行着大量数据同步和转换任务的分布式系统。其源端一般为各类偏实时的业务数据存储系统,目的端为各类数据仓库/对象存储。

二、企业数据融合平台的典型架构

下图为数据融合平台的典型架构,源端是不同的数据存储系统,另一端是各种类型的数据仓库,关系型数据库或者文件存储等。中间为数据融合平台的简单架构,组件Source connectors负责做数据的采集。

将数据采集之后,会将其做成格式化数据放到Transport Channel,Transport Channel一般会用Source队列或其它流式数据框架,负责做中间的缓存,包括分布式的支持,数据的分发, sink connectors去负责把数据分别写入不同的数据目的地。

在这里插入图片描述

三、企业数据融合需要解决的关键问题

  1. 数据异构问题

面临繁琐的数据源和目的地适配以及异构数据源的转换问题。

  1. 随时变化的数据结构

数据源结构会随时发生变化,造

Ficus FicusFicusFicus是由索贝自主研发的一站式数据管理和应用平台,致力于解决大治 是由索贝自主研发的一站式数据管理和应用平台,致力于解决大治 是由索贝自主研发的一站式数据管理和应用平台,致力于解决大治 是由索贝自主研发的一站式数据管理和应用平台,致力于解决大治 是由索贝自主研发的一站式数据管理和应用平台,致力于解决大治 是由索贝自主研发的一站式数据管理和应用平台,致力于解决大治 是由索贝自主研发的一站式数据管理和应用平台,致力于解决大治 是由索贝自主研发的一站式数据管理和应用平台,致力于解决大治 是由索贝自主研发的一站式数据管理和应用平台,致力于解决大治 是由索贝自主研发的一站式数据管理和应用平台,致力于解决大治 是由索贝自主研发的一站式数据管理和应用平台,致力于解决大治 是由索贝自主研发的一站式数据管理和应用平台,致力于解决大治 理过 程中面临的各类问题,如异构数据采集和存储、主管理计划编排自 程中面临的各类问题,如异构数据采集和存储、主管理计划编排自 程中面临的各类问题,如异构数据采集和存储、主管理计划编排自 程中面临的各类问题,如异构数据采集和存储、主管理计划编排自 程中面临的各类问题,如异构数据采集和存储、主管理计划编排自 程中面临的各类问题,如异构数据采集和存储、主管理计划编排自 程中面临的各类问题,如异构数据采集和存储、主管理计划编排自 程中面临的各类问题,如异构数据采集和存储、主管理计划编排自 程中面临的各类问题,如异构数据采集和存储、主管理计划编排自 程中面临的各类问题,如异构数据采集和存储、主管理计划编排自 程中面临的各类问题,如异构数据采集和存储、主管理计划编排自 程中面临的各类问题,如异构数据采集和存储、主管理计划编排自 程中面临的各类问题,如异构数据采集和存储、主管理计划编排自 定义、 接口管理定义、 接口管理定义、 接口管理定义、 接口管理定义、 接口管理定义、 接口管理定义、 接口管理定义、 接口管理BI 工具灵活性提升、运维设备监控等问题 工具灵活性提升、运维设备监控等问题 工具灵活性提升、运维设备监控等问题 工具灵活性提升、运维设备监控等问题 工具灵活性提升、运维设备监控等问题 工具灵活性提升、运维设备监控等问题 工具灵活性提升、运维设备监控等问题 工具灵活性提升、运维设备监控等问题 工具灵活性提升、运维设备监控等问题 工具灵活性提升、运维设备监控等问题 工具灵活性提升、运维设备监控等问题 工具灵活性提升、运维设备监控等问题 工具灵活性提升、运维设备监控等问题 工具灵活性提升、运维设备监控等问题 工具灵活性提升、运维设备监控等问题 工具灵活性提升、运维设备监控等问题 工具灵活性提升、运维设备监控等问题 。平台基于先进的 。平台基于先进的 。平台基于先进的 。平台基于先进的 。平台基于先进的 。平台基于先进的 。平台基于先进的 。平台基于先进的 KAPPA KAPPAKAPPAKAPPA架构,将批计算与流式完美融合后台功能模块采用微服务的部署方 架构,将批计算与流式完美融合后台功能模块采用微服务的部署方 架构,将批计算与流式完美融合后台功能模块采用微服务的部署方 架构,将批计算与流式完美融合后台功能模块采用微服务的部署方 架构,将批计算与流式完美融合后台功能模块采用微服务的部署方 架构,将批计算与流式完美融合后台功能模块采用微服务的部署方 架构,将批计算与流式完美融合后台功能模块采用微服务的部署方 架构,将批计算与流式完美融合后台功能模块采用微服务的部署方 架构,将批计算与流式完美融合后台功能模块采用微服务的部署方 架构,将批计算与流式完美融合后台功能模块采用微服务的部署方 架构,将批计算与流式完美融合后台功能模块采用微服务的部署方 架构,将批计算与流式完美融合后台功能模块采用微服务的部署方 式,方便 式,方便 版本迭代时 版本迭代时 版本迭代时 功能的可扩展性,平台接入了并 行计算处理力高效功能的可扩展性,平台接入了并 行计算处理力高效功能的可扩展性,平台接入了并 行计算处理力高效功能的可扩展性,平台接入了并 行计算处理力高效功能的可扩展性,平台接入了并 行计算处理力高效功能的可扩展性,平台接入了并 行计算处理力高效功能的可扩展性,平台接入了并 行计算处理力高效功能的可扩展性,平台接入了并 行计算处理力高效功能的可扩展性,平台接入了并 行计算处理力高效功能的可扩展性,平台接入了并 行计算处理力高效功能的可扩展性,平台接入了并 行计算处理力高效功能的可扩展性,平台接入了并 行计算处理力高效行处理海量数据 行处理海量数据 ,灵活的 ,灵活的 BI 工具决定了 工具决定了 工具决定了 Ficus FicusFicusFicus适用于多行业户的数据应, 适用于多行业户的数据应, 适用于多行业户的数据应, 适用于多行业户的数据应, 适用于多行业户的数据应, 适用于多行业户的数据应, 底层采用自主研发的融合数据库 底层采用自主研发的融合数据库 底层采用自主研发的融合数据库 底层采用自主研发的融合数据库 底层采用自主研发的融合数据库 VernoxVernox VernoxVernox,不仅高效支持中文检索,完全 不仅高效支持中文检索,完全 不仅高效支持中文检索,完全 不仅高效支持中文检索,完全 不仅高效支持中文检索,完全 自主研发 自主研发 自主研发 的特性 更是保证了底层数据安全和稳定的特性 更是保证了底层数据安全和稳定的特性 更是保证了底层数据安全和稳定的特性 更是保证了底层数据安全和稳定的特性 更是保证了底层数据安全和稳定的特性 更是保证了底层数据安全和稳定的特性 更是保证了底层数据安全和稳定
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值