kettle的转换和调优

Kettle是一款开源ETL工具,由四个核心组件组成:chef、kitchen、spoon和pan。本文介绍了如何设计Excel到MySQL的转换,并提供了一步步的配置案例。此外,还分享了Kettle性能优化策略,包括调整JVM大小、设置提交记录数、使用数据库连接池等,以提升数据处理效率。
摘要由CSDN通过智能技术生成

kettle的介绍

Kettle是一款纯java编写的, 开源的ETL工具,ETL是Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程.

kettle的两种设计:

在这里插入图片描述

kettle的核心组件:

kettle有四大核心组件: chef(工作设计工具), kitchen(工作执行器), spoon(转换设计工具), pan(转换执行器)

Transformation处理抽取,转换,加载各种对数据行的操作 ,包含一个或者多个步骤(step),如读取文件,过滤数据行,数据清洗,或者是将数据加载到数据库。 转换里的步骤通过跳(hop)来连接,跳定义了一个单项通道允许数据从一个步骤到向另一个步骤流动

hop跳用步骤之间带箭头的连线表示,跳定义了步骤之前的数据通路,是行集的数据行缓存,当行集满了,向行集写数据的步骤将停止写入,直到行集又有空间。当数据行空了,从行集读取的步骤停止读取,直到行集里又有可读的数据行。

并行: 让每一个步骤都是一个独立的线程运行,这样并发程度最高

Excel -> MySQL转换案例:

下面写一个从excel到MySQL数据库的案例:

1.第一步在kettle的目录中点击启动Spoon.bat命令

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值