数据导入 - Kafka 结合Doris Routine load 任务导入

pjc……

已于 2022-09-21 16:13:49 修改

阅读量1.4k

点赞数

文章标签： kafka java

于 2022-09-21 16:12:14 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44769246/article/details/126973522

版权

背景

参与项目有关数据采集，采集数据同步到数据库之前是使用sql的形式去进行同步，考虑到全表同步数据时数据量过大导致mybatis批量插入数据内存异常，原始解决方案采取分批次进行导入，但是同步数据速度相对会比较慢。这块已经达到性能的瓶颈相对来说优化的点很少

解决方案

采用消息中间件KAFKA结合Doris Routine load 例行任务进行数据同步，Kafka 是每秒几十万条消息吞吐对于大数据量处理上面性能比较好。而且它能进行部分时间内的数据保留，以及它单分区内能按顺序消费，也便于我们对后续数据同步出现问题做响应的处理。

Kafka 结合Doris Routine load 支持导入的格式csv， json 文本格式，我们这边采用csv 它相比与JSON来说粒度更细，更便于我们在数据同步时针对于出错数据做处理

流程图

在这里插入图片描述
批次号的解释：
相当于我有一个瓶子A现在往里面倒水倒满了就停然后换个瓶子B继续倒倒一半停了，我再换个瓶子C倒满再换瓶子D瓶子ABCD分布就对应批次号ABCD

模型：
这是我们导入数据的一种方式，每个业务数据采集对应一个采集模型

针对于导入出现异常的处理

这点主要利用kafka的一个偏移量offset去处理，主要针对两块进行处理，一块是重新导入（是当数据导入时导入数据的格式与数据库表的格式对应不上跳过这部分数据重新导入），第二块是继续导入（当导入数据的长度等大于数据库表字段长度时，保留数据修改数据库表后再次导入数据）。

流程图

在这里插入图片描述

这两块的配置具体可以参考doris routine load 中的配置可以实现

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
数据导入 - Kafka 结合Doris Routine load 任务导入

数据导入-kafka结合Doirs Routine Load任务导入
复制链接

扫一扫

pjc…… CSDN认证博客专家 CSDN认证企业博客

码龄5年

重庆超硅半导体有限公司

39: 原创

54万+: 周排名

30万+: 总排名

1万+: 访问

: 等级

389: 积分

12: 粉丝

12: 获赞

8: 评论

34: 收藏

私信

关注

热门文章

最新评论

线上垃圾分类回收系统-毕业设计01-JAVA
CSDN-Ada助手: 恭喜你完成了第15篇博客！看到你的毕业设计是关于线上垃圾分类回收系统的JAVA项目，真是令人钦佩。希望你能继续保持写作的热情和创作的动力。不知道你是否考虑过加入一些实际案例或者用户故事来丰富你的内容呢？这样可以让读者更加深入地了解你的项目，并且也能够为你的毕业设计提供更多有益的建议。期待看到你更多的精彩作品！
医院在线初诊平台系统-毕业设计02-JAVA
CSDN-Ada助手: 非常感谢作者持续创作并分享关于医院在线初诊平台系统的毕业设计。这是一个非常有意义且实用的项目。希望作者能够在下一步的创作中，加入更多实际案例分析和技术实现细节，让读者更深入地了解这个系统的设计和实施过程。期待作者的下一篇作品！
高校公选课平台系统-毕业设计03-JAVA
CSDN-Ada助手: 恭喜您写了第17篇博客！标题听起来非常有趣和具有挑战性。您对高校公选课平台系统的毕业设计进行了深入的探索，这是非常值得赞扬的。我很高兴看到您在JAVA领域的不断进步。在下一步的创作中，我建议您可以进一步探索该平台系统的实际应用场景，例如如何提高用户体验、加强系统的稳定性等方面。同时，您可以考虑分享一些与该主题相关的案例分析或者技术细节，这将进一步丰富您的博客内容。再次恭喜您的持续创作，并期待您未来更多优秀的博客文章！请保持谦虚的态度，继续努力！
毕业生离校管理系统-毕业设计04-JAVA
CSDN-Ada助手: 恭喜你写了第18篇博客！看到你在进行毕业设计的过程中，开发了一个毕业生离校管理系统，真是令人钦佩。你在JAVA领域的专业知识和技能显而易见，希望你能继续保持创作的热情。接下来，我建议你可以对你的毕业设计进行更深入的探讨，例如可以介绍具体的功能设计、技术实现等方面，这样能够更好地分享你的经验和知识，也会对读者有更大的帮助。期待你未来更多的精彩文章！
数据导入 - Kafka 结合Doris Routine load 任务导入
灰机哥！: 学到了，博主定时任务使用什么管理的啊

大家在看

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。