数据中台是什么
定义
数据中台是一套可持续“让企业的数据用起来”的机制,是一种战略选择和组织形式,是依据企业特有的业务模式和组织架构,通过有形的产品和实施方法论支撑,构建的一套持续不断把数据变成资产并服务于业务的机制
数据中台是处于业务前台和技术后台的中间层,是对业务提供的数据能力的抽象和共享的过程,数据中台通过将企业的数据变成数据资产,并提供数据能力组件和运行机制,形成聚合数据接入、集成、清洗加工、建模处理、挖掘分析,并以共享服务的方式将数据提供给业务端使用,从而与业务产生联动,而后结合业务系统的数据生产能力,最终构建数据生产>消费>再生的闭环,通过这样持续使用数据、产生智能、反哺业务从而实现数据变现的系统和机制
更新后
1.支持 MongoDB
新版数睿通的数据接入和数据生产模块添加了 MongoDB 的支持,数据接入可以选择 MongoDB 作为源端或者目的端进行数据同步操作。数据生产可以创建 MongoDB 类型的作业任务。现在的数据生产模块已经可以支持 Flink1.16,Flink1.16 官方已经支持 MongoDB 的连接器,所以在平台可以建立 MongoDB 类型的 FlinkSql 任务,提交到 Flink 集群或者 Yarn 上面执行,但具体效果还需要进一步测试,后续版本平台在建立数据生产任务的时候,将可以动态选择 Flink 版本执行相应的任务
2.支持 FlinkJar 任务
之前版本的数据生产支持 Sql 和 FlinkSql 两种任务类型,通过这两种方式可以完成大部分的实时和离线开发需求,但如果遇到复杂的业务,仅靠这两种方式显得有些力不从心,所以新版支持了 FlinkJar 类型的任务,通过数据开发人员编写任务代码,打成 Jar 包提交到平台,应对复杂的数据开发需求,当前支持提交任务到 Flink 集群或 Yarn 集群