商业智能-大数据-后端工作-DATAWORKS(2) 数据集成的步骤和操作/MYSQL 数据离线集成到dataworks(1)

背景:dataworks提供数据离线批量数据同步。在次离线(批量)的数据通道主要通过定义数据来源和去向的数据源和数据集,提供一套抽象化的数据抽取插件(称之为 Reader)、数据写入插件(称之为 Writer),并基于此框架设计一套简化版的中间数据传输格式,从而达到任意结构化、半结构化数据源之间数据传输的目的。

数据集成的基本步骤如下:

步骤一:点击左上角的LOGO,选择 ‘数据集成’ 模块,点击右上角的新增数据源。

步骤二:根据自己的需求选择需要的数据库连接。

----目前可支持的数据源类型有:

  1. 文本存储(FTP/SFTP/OSS/多媒体文件等)。
  2. 数据库(RDS/DRDS/MySQL/PostgreSQL等)。
  3. NoSQL(Memcache/Redis/MongoDB/HBase等)。
  4. 大数据(MaxCompute/AnalyticDB/HDFS等)。
  5. MPP数据库(HybridDB for MySQL等)。

由于每个数据源的配置信息差距较大,需要根据使用情况详细查询参数配置信息。所以在数据源配置、作业配置页面提供了详细描述,请您根据自身情况进行查询使用。---

这里我使用的是 RDS 的MySQL

步骤三:填写连接信息。

这里的RDS实例的ID是在RDS管理控制台的基本信息页面,如下:

主账ID,要登录控制台,进入安全设置中可以看到实例账号ID,如果你是子账号的话,记得要用主账号。

点击测试连通性。OK成功,点击完成。

结果如下:

步骤四:点击整库迁移批量配置。进入该界面,选择自己需要的同步方式,

 

在这我选择每个一小时,增量分批上传库表ipaddress.  由于是选择增量上传,那么dataworks系统会要求一个增量叛变的标准(就是分区的变量,一般是日期),我这边选择的是crawl_time,我爬取下来的IP地址的时间。

点击提交,同步成功。接下里,每天每个小,dataworks会增强同步一次任务。

补充:如果你要求实时秒级别的同步也是OK的同步数据,也是OK的,我这边使用的是DTS的方案。

。之前个做的可视化产品的模板,也是使用这套方案,很好用。

效果如下:

备注:由于数据保密,所以在这里本人写了脚本产生的虚拟的数据。

dataworks的使用地图,宏观上帮助了解大致的框架。

 

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
Spring Boot 中集成数据源可以通过配置多个数据源的方式实现。下面是集成 JDBC 和 Neo4j、MySQL 的示例: 1. 添加依赖 在 pom.xml 文件中添加以下依赖: ``` <!-- MySQL --> <dependency> <groupId>mysql</groupId> <artifactId>mysql-connector-java</artifactId> </dependency> <!-- Neo4j --> <dependency> <groupId>org.neo4j.driver</groupId> <artifactId>neo4j-java-driver</artifactId> <version>4.3.2</version> </dependency> ``` 2. 配置数据源 在 application.properties 或 application.yml 文件中配置数据源。 ``` # MySQL spring.datasource.url=jdbc:mysql://localhost:3306/db1?useSSL=false spring.datasource.username=root spring.datasource.password=root # Neo4j spring.data.neo4j.uri=bolt://localhost:7687 spring.data.neo4j.username=neo4j spring.data.neo4j.password=admin ``` 3. 配置数据源 bean 在配置类中配置数据源 bean,使用 @Primary 注解标记默认数据源。 ``` @Configuration public class DataSourceConfig { // MySQL 数据源 @Bean(name = "mysqlDataSource") @Primary @ConfigurationProperties(prefix = "spring.datasource") public DataSource mysqlDataSource() { return DataSourceBuilder.create().build(); } // Neo4j 数据源 @Bean(name = "neo4jDataSource") @ConfigurationProperties(prefix = "spring.data.neo4j") public DataSource neo4jDataSource() { return new DriverDataSource(GraphDatabase.driver("bolt://localhost:7687", AuthTokens.basic("neo4j", "admin"))); } } ``` 4. 配置 JdbcTemplate 在配置类中配置 JdbcTemplate,分别使用 @Qualifier 注解指定数据源 bean。 ``` @Configuration public class JdbcTemplateConfig { // MySQL JdbcTemplate @Bean(name = "mysqlJdbcTemplate") public JdbcTemplate mysqlJdbcTemplate(@Qualifier("mysqlDataSource") DataSource dataSource) { return new JdbcTemplate(dataSource); } // Neo4j JdbcTemplate @Bean(name = "neo4jJdbcTemplate") public JdbcTemplate neo4jJdbcTemplate(@Qualifier("neo4jDataSource") DataSource dataSource) { return new JdbcTemplate(dataSource); } } ``` 5. 使用 JdbcTemplate 在需要使用 JdbcTemplate 的地方,使用 @Qualifier 注解指定对应的数据源 bean。 ``` @Service public class UserService { @Autowired @Qualifier("mysqlJdbcTemplate") private JdbcTemplate mysqlJdbcTemplate; @Autowired @Qualifier("neo4jJdbcTemplate") private JdbcTemplate neo4jJdbcTemplate; public void getUser() { // 使用 MySQL JdbcTemplate 查询用户 mysqlJdbcTemplate.queryForObject("SELECT * FROM user WHERE id = ?", new Object[]{1}, (rs, rowNum) -> { // do something }); // 使用 Neo4j JdbcTemplate 查询用户 neo4jJdbcTemplate.queryForObject("MATCH (u:User {id: $id}) RETURN u", Collections.singletonMap("id", 1), (rs, rowNum) -> { // do something }); } } ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值