一.tsv文件抽取
1.通过使用Kettle工具,创建一个转换tsv_extract,添加“文本文件输入”控件、“表输出”控件以及Hop跳连接线,具体如图所示。
2.双击“文本文件输入”控件,进入“文本文件输入”界面
单击【浏览】按钮,选择要抽取的文件tsv_extract.tsv。单击【增加】按钮,将要抽取的TSV文件添加到转换“tsv_extract”中。
单击“内容”选项卡,清除分隔符处默认分隔符“;”并单击【Insert TAB】按钮,在分隔符处插入一个制表符;取消勾选“头部”复选框。
单击【预览记录】按钮,查看文件tsv_extract.tsv的数据是否成功抽取到文本文件输入流中。
3.配置表输出控件
双击“表输出”控件,进入“表输出”控件的配置界面。单击【新建】按钮,配置数据库连接,配置完成后单击【确认】按钮。
单击目标表右侧的【浏览】按钮,获取目标表,即数据表tsv。
勾选图4-13中的“指定数据库字段”复选框。
单击“数据库字段”选项卡,再单击【输入字段映射】按钮,弹出“映射匹配”对话框,将“源字段”选项框的字段和“目标字段”选项框对应的字段进行映射匹配。
“表输出”控件配置的最终效果,具体如图所示。
3.运行转换
单击转换工作区顶部的 按钮,运行创建的tsv_extract转换。结果如图
在数据库中结果如图
二.CSV文件的抽取
1.通过使用Kettle工具,创建一个转换csv_extract,并添加“CSV文件输入”控件、“表输出”控件以及Hop跳连接线,具体如图所示。
2.配置CSV文件输入控件
双击“CSV文件输入”控件,进入“CSV文件输入”界面。单击【浏览】按钮,选择要抽取的文件csv_extract.csv。
单击【获取字段】按钮,Kettle自动检索CSV文件,并对文件中的字段类型、格式、长度、精度等属性进行分析。
单击【预览】按钮,查看文件csv_extract.csv的数据是否抽取到CSV文件输入流中。
3.配置表输出控件
双击“表输出”控件,进入“表输出”控件的配置界面。单击【新建】按钮,配置数据库连接,配置完成后单击【确认】按钮。
单击目标表右侧的【浏览】按钮,获取目标表,即数据表csv;勾选“指定数据库字段”的复选框。
单击“数据库字段”选项卡,再单击【输入字段映射】按钮,弹出“映射匹配”对话框,将“源字段”选项框的字段和“目标字段”选项框对应的字段进行映射匹配。
表输出”控件配置的最终效果,具体如图所示。
4.运行转换
单击转换工作区顶部的 按钮,运行创建的csv_extract转换。运行结果如图
在数据库中结果如图