kettle是个开源的ETL工具,能将多种形式的数据源数据抓取到数据库中。

将Excel文件中的数据导入数据库。

1.创建一个转换,单击文件->文件->转换。

2.从输入菜单中选择Excel输入。

3.配置要导入的 Excel文件,点击浏览选择文件。

153027275.png


如果想读取文件夹下以.xls为后缀的文件,kettle支持正则表达式,在规则表达式中写入正则表达式^.+\.xls$。点击“增加”,增加文件或目录和规则表达式。

154055716.png


可以单击“显示文件名称”测试正则表达式是否正确。

154316188.png


4.配置sheet页名称,选择“工作表”Tab页,点击"获取获取工作表名称",在可用项目中选择sheet页名称

154941535.png

5.配置文件中导入字段。选择“字段”Tab页,点击“获取来自头部数据字段”。

161709648.png


6.配置导入的数据库 ,在输出菜单中选择表输出。配置数据源和要输出的表名。如果没有数据库连接可点击“新建”,配置对应数据库的连接,注:在使用JDBC时,需要对应的驱动包。

155637829.png

7.配置文件与表之间的映射关系。在“表输出”中选择“database fields”,点击“enter field mapping”,选择mapping关系。

162430993.png

Excel文件中的数据导入数据库的配置已经完成。点击运行。

163109794.png

可将作业与转换整合,定时扫描文件夹将Excel文件中的数据导入数据库。

1.创建一个作业,单击文件->文件->作业。

2.在“通用”菜单中选择START,配置作业的时间以及间隔时间。

163815661.png


3.在“通用”菜单中选择Transformation,配置转换。

164016820.png

4.在“通用”菜单中选择Success。

164224643.png


作业已经与转换关联起来,根据设置的时间会定时执行作业。点击“运行“。

165112172.png