目录
一.XML文件介绍
XML是一种可扩展标记语言,也是一种元标记语言,所谓“元标记”就是开发者可根据自己的需要自定义标记。XML是一种很像HTML的标记语言,但是它们也有很大的区别,譬如XML被设计出来主要用于传输和存储数据,其焦点是数据的内容,而HTML被设计出来主要用于显示数据,其焦点是数据的外观;XML中的标签是没有被预定义的,都是由XML文档的创作者发明的,HTML中的标签是预定义的,其文档中使用的标签必须是在HTML标准中定义过的,对于用户自己定义的标签是不可使用的。
二.XML文件的主要用途
XML应用于Web开发的多个方面,但常用于简化数据的存储和共享。XML的主要用途,具体介绍如下: XML可以将数据从HTML中分离、 XML可以简化数据传输 、XML可以简化数据共享、 XML简化平台变更 、XML可以使数据充分利用、 XML可用于存储数据、 XML可以用于创建新的互联网语言。
三.案例介绍
通过Kettle工具抽取XML文件xml_extract.xml中的数据并保存至数据库extract的数据表xml中。
数据准备
现有一个XML文件名为xml_extract.xml ,该文件的内容如图所示。
注意:涉及到数据库操作,提前在kettle里面连接好数据库。
四.案例实现
1.建立转换
2.配置控件
Get date from XML控件:双击控件进入配置界面,点击浏览,找到需要处理的文件
xml_extract.xml,并点击增加,具体如下。
点击内容选项卡,单击【获取XML文档的所有路径】选择循环读取路径,
即/AllRows/Rows/Row。
点击字段选项卡,添加要抽取的字段,具体如下:
点击预览数据:
表输出控件:双击进入表输出控件(前提一定要连接好数据库),选择目标表xml,具体如下:
勾选下方指定数据库字段后,点击下方数据库字段,切换到数据库字段界面后,点击右侧输入字段映射按钮,进行映射匹配,具体如下。
3.保存运行转换