kettle和MongoDB之间的数据同步

最新推荐文章于 2024-07-26 03:35:53 发布

lwqhp

最新推荐文章于 2024-07-26 03:35:53 发布

阅读量6.7k

点赞数

分类专栏： Kettle

Kettle 专栏收录该内容

1 篇文章 1 订阅

订阅专栏

参考文章：http://edpflager.com/?p=1642

最近有一个调优的项目设计到MongoDB数据转移到Mysql库进行数据分析。

以下是利用kettle对数据的转换的介绍：

1：MongoDb的查询：

主要是基于json格式：具体的查询可以见连接 MonGoDb的查询语句。

数据集是

由于带有时间戳timestamp,可以在kettle中基于时间戳对其增量读取。

2：kettle对于这种非关系型的数据库的设置主要是利用bigdata的控件：

配置如下：

1）mongodb的数据集

2）query 查询语句

由于利用时间戳进行增量查询，所以利用了两个变量${STARTDATE},${ENDDATE}来控制时间窗的大小。

3.将数据流传入到json输入中，将其转化为标准格式：

Path的书写格式是：

$.uid:uid是指mongodb中的项uid,

$ :代表根目录

. :代表子节点

[]:数组节点

由于在mongodb中uid是直接挂在根目录下的子节点中，所以其路径为$.uid,actionID依次类似。

例：

{"data" :{

"museum":[

{

"country":"italy",

"city": "Vencie",

"id_museum":"109",

"name":"pa"},

{

"country":"Mexico",

"city": "Mexico city",

"id_museum":"36",

"name":"Musre"}

]

}

$..city表明元素city是在根节点下data节点内的museum节点内。

$.data.museum[1].city表明指定的元素，即上述museum数组第二个节点的city值

数据读取流程图：

JOB的流程如下：

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

lwqhp

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Kettle同步MonggoDB超详细

Jmayday

02-08

3337

kettle数据同步

使用kettle采集并处理MongoDB数据库中的数据

需要远程指导仿真实验、代码有问题的，请后台私信或者关注公众号

07-07

4519

本实验任务主要完成基于ubuntu环境的使用kettle采集并处理MongoDB数据库中的数据的工作。通过完成本实验任务，要求学生熟练掌握使用kettle采集并处理MongoDB数据库中的数据的方法，为后续实验的开展奠定ETL平台基础，也为从事大数据平台运维工程师、大数据技术支持工程师等岗位工作奠定夯实的技能基础。1、掌握使用kettle采集并处理MongoDB数据库中的数据Ubuntu16.04、Java1.8、Kettle7.1、MongoDB3.6.2Kettle 中文名称叫水壶，该项目的主程序员MA

参与评论您还未登录，请先登录后发表或查看评论

kettle 连接mongodb

weixin_41504807的博客

07-26

310

【kettle007】kettle访问MongoDB数据库并处理数据至execl文件（已更新）

kngines

04-29

763

1.一直以来想写下基于kettle的系列文章，作为较火的数据ETL工具，也是日常项目开发中常用的一款工具，最近刚好挤时间梳理、总结下这块儿的知识体系。 2.熟悉、梳理、总结下MongoDB数据库相关知识体系。 3.欢迎批评指正，跪谢一键三连！

kettle抽取mongodb数据，查询条件为object类型

qq_31947511的博客

05-21

2788

MongoDB中user_org格式为：查询时，

kettle连接mongodb input

最新发布

weixin_41395819的博客

07-26

148

使用Kettle增量抽取MongoDB数据实践

12-14

在IT行业中，数据抽取、转换和加载（ETL）是数据仓库和大数据处理的重要环节。在本实践案例中，我们将探讨如何使用Kettle工具...在大数据环境中，灵活处理各种数据源和目标，是提升数据处理效率和确保数据同步的关键。

mysql etl mongodb_kettle之mongodb数据同步

weixin_42513546的博客

01-27

744

需求：1.源数据库新增一条记录，目标库同时新增一条记录；2.源数据库修改一条记录，目标库同时修改该条记录；示例用到三个Kettle组件下面详细说下每个组件的配置Source:本示例连接的是Mongodb数据库，四个字段，ID默认为主键，_id会系统自动生成暂时先不管。值映射：本步在本示例作用不大，只是为了测试效果。按照截图上进行配置即可MongoDbOutput:关键是这一步的配置官网上对这个ta...

使用Kettle同步mysql数据，增量同步教程执行步骤

10-24

在IT行业中，数据同步是一项关键任务，特别是在大数据处理和企业级应用中。本文将深入探讨如何使用Kettle工具实现MySQL数据库之间的增量同步。Kettle，也称为Pentaho Data Integration (PDI)，是一款强大的ETL（提取...

kettle 读入 MongoDB 数据

weixin_30505751的博客

08-05

1270

　　经过测试发现，如果 MongoDB 需要验证的话，kettle 的 “MongoDB input” 组件是无法连接 MongoDB 的。　　（kettle 6.1 以及以下，如果你的连接成功了，请指教，谢谢，QQ：415426435）　　那么我们怎么用 kettle 读入 MongoDB 的数据呢，笔者是如下操作的。第一步：把 MongoDB 的数据导出成 JSON 文件　　参...

spoon 连接mongodb

01-08

pdi-ce-7.1.0.0-12连接mongodb并设定时间参数查询数据

kettle：mongdb与mysql互传数据

weixin_30701575的博客

12-28

329

注：部分内容引用了http://blog.sina.com.cn/s/blog_4ac9f56e0101g881.html1、mongodb传数据到mysql1)在kettle中，mongodb input组件。2)编辑组件输入连接信息选择数据库写查询语句选择字段。上面的复选框选择是否输入json格式，这时不选。点击get fileds，获取字段对应关系。$代表根目录.代表子目录[]代表数组中的...

kettle进行mongodb数据迁移

gdj_career2008的专栏

05-18

578

通过kettle对mongodb进行数据的迁移

基于kettle实现pg数据定时转存mongodb

陈泽钦的博客

08-08

770

基于kettle实现pg定时转存数据到mongodb中...

KETTLE（二）--kettle连接MongoDB转换到MySQL

weixin_45938400的博客

10-11

3571

下载 mongodb连接：1.https://www.mongodb.com/try#community 2.https://www.mongodb.com/try/download/community 使用Kettle抽取MongoDB的数据到MySQL数据等关系型数据库中还是比较简单的，因为Mongo中存储的都是json格式的数据，所以取出数据后按照json的格式拆分出来就行啦。流程 1.数据转换 1点击BigData–>MongoDB input 连接连接到mysql

MongoDB数据迁移之迁移工具Kettle

weixin_36723038的博客

12-01

1992

Kettle是一款国外开源的ETL工具，纯java编写，可以在Window、Linux、Unix上运行，绿色无需安装，数据抽取高效稳定。Kettle 中文名称叫水壶，该项目的主程序员MATT 希望把各种数据放到一个壶里，然后以一种指定的格式流出。Kettle这个ETL工具集，它允许你管理来自不同数据库的数据，通过提供一个图形化的用户环境来描述你想做什么，而不是你想怎么做。

kettle抽取mongodb数据时——时间查询的问题

topc2000的博客

10-21

2485

kettle在查询mongodb的时候少不了会进行检索时间，查询某个时间段内的数据。比如~ [{ $match : { "createTime": { $lt: { "$date": "2019-10-19T16:00:00.000Z" }, $gt: { "$date": "2019-10-18T00:00:00.000Z" }, } } ...

Kettle 提取mongodb最大编号

weixin_30635053的博客

08-14

362

从mongodb中提取指定日期的最大编号简单实例使用mongodb input抽取配置 1.数据库连接配置 2.配置数据库和数据集，配置的用户名密码不具有获取数据库列表的前线，使用Get DBS取不到数据库列表，直接填写要链接的数据库名字就好，然后Get Collections就能取到数据集，然后使用选择查询的表。 3.配置查询语句，因为mongodb中查询一条数据要使用$lim...

kettle案例七连接hive--抽取mongodb的数据保存到hive