kettle案例4.2.2--抽取Web数据---XML文件的数据抽取

本文详细介绍了如何使用Kettle工具从XML文件中抽取数据并存储到数据库中,包括配置XML输入和表输出控件,以及数据字段的映射匹配,最终成功将6条数据插入到数据表中。

kettle案例4.2.2–抽取Web数据—XML文件的数据抽取

XML是一种可扩展标记语言,也是一种元标记语言,所谓“元标记”就是开发者可根据自己的需要自定义标记。
XML是一种很像HTML的标记语言,但是它们也有很大的区别,譬如XML被设计出来主要用于传输和存储数据,其焦点是数据的内容,而HTML被设计出来主要用于显示数据,其焦点是数据的外观
XML中的标签是没有被预定义的,都是由XML文档的创作者发明的,HTML中的标签是预定义的,其文档中使用的标签必须是在HTML标准中定义过的,对于用户自己定义的标签是不可使用的。

XML应用于Web开发的多个方面,但常用于简化数据的存储和共享。XML的主要用途,具体介绍如下:

  • XML可以将数据从HTML中分离
  • XML可以简化数据传输
  • XML可以简化数据共享
  • XML简化平台变更
  • XML可以使数据充分利用
  • XML可用于存储数据
  • XML可以用于创建新的互联网语言

案例介绍

通过Kettle工具抽取XML文件xml_extract.xml中的数据并保存至数据库extract的数据表xml中

数据准备

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值