一、作业:通过Kettle工具,实现以下功能:
(1)抽取CSV文件csv_extract.csv中的数据保存至数据库extract中的数据表csv中。
(2)抽取JSON文件jaon_extract.js中的数据保存至数据库extract中的数据表jaon中。
(1)抽取CSV文件csv_extract.csv中的数据保存至数据库extract中的数据表csv中。
1.打开kettle的运行窗口 -> 点击新建 ->点击转换
2.左侧对话框中找到表输出,点击输入 ->点击->>点击CSV文件输入
3.接着点击输出 -> 点击表输出 ->完成,界面如图所示
4.配置CSV文件输入控件
双击“CSV文件输入”控件进入界面,单击下图中“浏览”按钮,选择要抽取的文件csv_extract.csv。单击“获取字段”按钮自动检索CSV文件,单击“浏览”按钮,查看文件csv_extract.csv中的数据是否抽取到CSV文件输入流中。单击“关闭”按钮,完成“CSV文件输入”控件配置。
5.配置表输出控件
双击“表输入”控件进入界面,单击“新建”按钮,配置数据库连接,完成后单击“确认”按钮。
单击“浏览”按钮,选择输出的目标表csv_extract.csv,勾选“指定数据库字段”复选框,用于将数据表csv的字段与CSV文件中的字段进行匹配。单击“输入字段映射”按钮,弹出“映射匹配”对话框,依次选中“源字段”中的字段和“目标字段”中的对应字段进行映射。完成后单击“确定”按钮完成配置
6.点击运行界面,结果如图所示
7.打开SQLyog查看csv文件是否数据插入成功
(2)抽取JSON文件jaon_extract.js中的数据保存至数据库extract中的数据表jaon中。
1.提前创建数据库在SQL中,数据库为extract,表名称为josn
2.打开kettle工具创建转换json_extract
3.配置json input 控件
双击JOSN input控件进入“JOSN输入”界面。单击“浏览”按钮,选择要抽取的JOSN文件josn_extract.josn。单击“增加”按钮,将所选择的文件添加到“选中的文件”处。
单击“字段”界面,添加要抽取的数据字段,单击“确定”按钮,完成JOSN input控件的配置。
双击JOSN input2控件,进入“JOSN输入”界面,勾选“源定义在一个字段里?”复选框,在“从字段获取数据源”后的下拉列表中选择字段名data。
单击“字段”选项卡进入界面,添加从字段data中抽取的field和value字段,单击“确定”完成JOSN input2控件的配置。
4. 配置表输出控件
双击“表输出”控件进入界面,单击“新建”按钮,配置数据库连接,完成后单击“确认”按钮。
单击“浏览”按钮,选择输出的目标表josn,勾选“指定数据库字段”复选框,用于将数据表josn的字段与JOSN文件中的字段进行匹配。
单击“输入字段映射”按钮,弹出“映射匹配”对话框,依次选中“源字段”中的字段和“目标字段”中的对应字段进行映射。完成后单击“确定”按钮完成配置。
5.运行转换josn_extract,在数据库中查看运行结果
二、控件总结
1、文本文件输入控件、 CSV文件输入控件
2、自定义常量数据输入控件
3、HTTP client控件
4、Java代码控件
5、Get data from XML控件
6、JSON input控件
7、MongoDB input控件
8、表输出控件
9、表输入控件