数栈-数据集成学习笔记

个人博客原文链接简介数据集成模块是在各个存储单元之间执行数据交换的通道,具备分布式底层架构,稳定高效、弹性伸缩的特点,致力于提供复杂网络环境下、丰富的异构数据源之间数据高速稳定的数据移动及同步能力。为了在DTinsightBatch进行大规模数据集的挖掘与计算,通常的做法是在任务执行前将数据传输至DTinsightBatch,并在任务执行结束后将计算结果传输至外部存储单元(例如MySQL等应用...
摘要由CSDN通过智能技术生成

个人博客原文链接

简介

数据集成模块是在各个存储单元之间执行数据交换的通道,具备分布式底层架构,稳定高效、弹性伸缩的特点,致力于提供复杂网络环境下、丰富的异构数据源之间数据高速稳定的数据移动及同步能力。为了在DTinsightBatch进行大规模数据集的挖掘与计算,通常的做法是在任务执行前将数据传输至DTinsightBatch,并在任务执行结束后将计算结果传输至外部存储单元(例如MySQL等应用数据库)。数据集成的作用如下图所示:
数栈输入与输出图

数据源类型

数据集成提供丰富的数据源支持,如下所示:

  1. 关系型数据库(MySQL / Oracle / SQLServer / PostgreSQL等)
  2. NoSQL(Redis / MongoDB / HBase / ElasticSearch等)
  3. 大数据存储(MaxCompute / HDFS / Hive等)
  4. 文本存储(FTP)
    注1:Redis不支持抽取
    注2:Redis、MongoDB、ElasticSearch不支持向导

数据源管理

数据源管理是对外部存储单元访问参数的管理,数据集成模块需要与数据开发配合起来才能发挥作用,实际是由定时任务来执行数据传输的。

在项目上方的数据集成菜单,进入数据数据源管理页面,可看到目前已经集成的数据源列表,包括数据源名称、类型、连接信息、描述、最近修改人、最近修改时间、状态等信息,同时可执行编辑、删除等操作。

在数据源列表右上角的新增数据源,选择不同的数据源类型,需要填写不同的配置信息。
具体配置信息:

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值