案例介绍
通过Kettle工具抽取TSV文件tsv_extract.tsv中的数据保存至数据库extract中的数据表tsv中。
案例实现
1.打开Kettle工具,创建转换tsv_extract
通过使用Kettle工具,创建一个转换tsv_extract,添加“文本文件输入”控件、“表输出”控件以及Hop跳连接线,具体如图所示。
2.配置文本文件输入控件
双击“文本文件输入”控件,进入“文本文件输入”界面,单击【浏览】按钮,选择要抽取的文件tsv_extract.tsv。
单击【增加】按钮,将要抽取的TSV文件添加到转换“tsv_extract”中。
单击“内容”选项卡,清除分隔符处默认分隔符“;”并单击【Insert TAB】按钮,在分隔符处插入一个制表符;取消勾选“头部”复选框。
单击“字段”选项卡,切换到“字段”选项卡界面。 “字段”选项卡的配置如下图。
单击【预览记录】按钮,查看文件tsv_extract.tsv的数据是否成功抽取到文本文件输入流中。
3.配置表输出控件
双击“表输出”控件,进入“表输出”控件的配置界面。
单击【新建】按钮,配置数据库连接,配置完成后单击【确认】按钮。
单击目标表右侧的【浏览】按钮,获取目标表,即数据表tsv。勾选图4-13中的“指定数据库字段”复选框。
单击“数据库字段”选项卡,再单击【输入字段映射】按钮,弹出“映射匹配”对话框,将“源字段”选项框的字段和“目标字段”选项框对应的字段进行映射匹配。
“表输出”控件配置的最终效果,具体如图所示。
4.运行tsv_extract转换
单击转换工作区顶部的按钮,运行创建的tsv_extract转换。
5.查看tsv数据表中的数据
通过SQLyog工具,查看数据表tsv是否已成功插入五行数据。