将一个TSV文件运用Kettle工具进行抽取并保存至数据库中的数据表TSV中。实现将一个保存在本地的TSV文件进行抽取
1.数据准备与查看数据
2.在Kettle新建转换,添加“文本输入”控件“表输出”控件以及Hop跳连线
3.配置“文本文件输入”控件
(1).双击“文本文件输入”控件,进入“文本文件输入”界面
(2).选择数据
(3).点击“预览”按钮,选择要抽取的文件tsv_extract.tsv
(4).点击“增加”按钮,将要抽取的TSV文件添加到转换中
(5).点击“内容”选项卡
(6)清除分隔符处的默认分隔符“;”,点击Insert TAB按钮,在分隔符处插入一个制表符,取消勾选“头部”复选框
(7)点击“字段”选项卡,切换到“字段”选项卡界面
(8)根距TSV文件的内容添加对应的字段名称,并指定数据类型,在“去除空字符串方式”列,所添加是字段都应选择“不去除空格”
(9)点击”预览记录“查看数据是否抽取到文本文件输入流中,如果成功抽取则点击“关闭”“确定”
3.配置“表输出”控件
(1).双击进入“表输出”控件,进入“表输出”界面
(2)新建数据库运行sql文件
(3)选择新建按钮,配置数据库连接,测试是否成功
(4)点击“目标表”右侧的“浏览”按钮,指定输出表
(5)勾选“指定数据库字段”复选框,用于将数据表tsv的字段与文件中的字段进行匹配
(6)点击“数据库字段”选项卡
(7)点击“输入字段映射”按钮,弹出“映射匹配”对话框。依次选中“原字段”中的字段和“目标字段”中对应的字段,在点击Add按钮
(8)点击“确定”按钮完成“表输出”控件配置。
4.运行转换
5.查看tsv数据库中的数据