4.2Kettle数据抽取——XML文件的数据抽取

XML是一种可扩展标记语言,也是一种元标记语言。

所谓“元标记”,就是开发者可根据自己的需要自定义标记。XML 是一种很像 HTML 的标记语言,但是它们也有很大的区别,如 XML被设计出来,主要用于传输和存储数据,其焦点是数据的内容,HTMI被设计出来,主要用于显示数据,其焦点是数据的外观;XML 中的标签是没有被预定义的,都是由 XML 文档的创作者发明的,HTML中的标签是预定义的,其文档中使用的标签必须是在 HTML标准中定义过的,用户自己定义的标签是不可使用的。

现有一个XML文件,名为xml_extract,具体内容如下

下面将分布演示如何抽取XML文件中的数据并保存至数据库中。

1.打开kettle工具,创建转换xml_extract,并添加如下控件及Hop跳连接线

2.配置Get data from XML控件

预览数据

3.配置“表输出”控件

提示:数据库中的目标表需要提前创建(这里不再赘述创建过程)

连接数据库

 4.运行转换xml_extract,并查看数据表xml表(选择自己顺手的软件即可)

成功!

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值