XML是一种可扩展标记语言,也是一种元标记语言。
所谓“元标记”,就是开发者可根据自己的需要自定义标记。XML 是一种很像 HTML 的标记语言,但是它们也有很大的区别,如 XML被设计出来,主要用于传输和存储数据,其焦点是数据的内容,HTMI被设计出来,主要用于显示数据,其焦点是数据的外观;XML 中的标签是没有被预定义的,都是由 XML 文档的创作者发明的,HTML中的标签是预定义的,其文档中使用的标签必须是在 HTML标准中定义过的,用户自己定义的标签是不可使用的。
现有一个XML文件,名为xml_extract,具体内容如下
下面将分布演示如何抽取XML文件中的数据并保存至数据库中。
1.打开kettle工具,创建转换xml_extract,并添加如下控件及Hop跳连接线
2.配置Get data from XML控件
预览数据
3.配置“表输出”控件
提示:数据库中的目标表需要提前创建(这里不再赘述创建过程)
连接数据库
4.运行转换xml_extract,并查看数据表xml表(选择自己顺手的软件即可)
成功!