XML文件的数据抽取

目录

一.XML文件介绍

二.XML文件的主要用途

三.案例介绍

         数据准备

 四.案例实现

        1.建立转换

         2.配置控件

         3.保存运行转换


一.XML文件介绍

        XML是一种可扩展标记语言,也是一种元标记语言,所谓“元标记”就是开发者可根据自己的需要自定义标记。XML是一种很像HTML的标记语言,但是它们也有很大的区别,譬如XML被设计出来主要用于传输和存储数据,其焦点是数据的内容,而HTML被设计出来主要用于显示数据,其焦点是数据的外观;XML中的标签是没有被预定义的,都是由XML文档的创作者发明的,HTML中的标签是预定义的,其文档中使用的标签必须是在HTML标准中定义过的,对于用户自己定义的标签是不可使用的。

二.XML文件的主要用途

        XML应用于Web开发的多个方面,但常用于简化数据的存储和共享。XML的主要用途,具体介绍如下: XML可以将数据从HTML中分离、 XML可以简化数据传输 、XML可以简化数据共享、 XML简化平台变更 、XML可以使数据充分利用、 XML可用于存储数据、 XML可以用于创建新的互联网语言。

三.案例介绍

        通过Kettle工具抽取XML文件xml_extract.xml中的数据并保存至数据库extract的数据表xml中。

        数据准备

                现有一个XML文件名为xml_extract.xml ,该文件的内容如图所示。

                注意:涉及到数据库操作,提前在kettle里面连接好数据库。

 四.案例实现

        1.建立转换

         2.配置控件

        Get date from XML控件:双击控件进入配置界面,点击浏览,找到需要处理的文件

                                                   xml_extract.xml,并点击增加,具体如下。

         点击内容选项卡,单击【获取XML文档的所有路径】选择循环读取路径,

        即/AllRows/Rows/Row。

        点击字段选项卡,添加要抽取的字段,具体如下:

         点击预览数据:

         表输出控件:双击进入表输出控件(前提一定要连接好数据库),选择目标表xml,具体如下:

           勾选下方指定数据库字段后,点击下方数据库字段,切换到数据库字段界面后,点击右侧输入字段映射按钮,进行映射匹配,具体如下。

         3.保存运行转换

 

 

 

 

  • 4
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

CC-Betsy

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值