Kettle 使用备忘录：生成xml文件

最新推荐文章于 2024-09-20 14:22:42 发布

波特王子

最新推荐文章于 2024-09-20 14:22:42 发布

阅读量3.9k

点赞数 1

分类专栏： Kettle学习

Kettle学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

本文详细介绍了如何使用Kettle中的组件（如addxml、xmljoin、placeholder、jsscript等）生成复杂的XML文件，包括如何从Excel数据源读取内容、使用addxml组件生成XML元素、使用mergejoin组件优化匹配过程、以及如何通过xpath实现复杂条件的XML合并。最后，文章还演示了如何使用JS脚本来调整输出，并将最终XML流输出到文件中。

摘要由CSDN通过智能技术生成

1. 利用 excel中的数据生成xml文件

kettle中的xml文件输出组件的功能其实是很弱的，所以要生成较为复杂的xml文件时需要使用组件：

add xml , xml join, placeholder, js script 等等

使用merge join主要是为了减少在xml join中需要匹配的结果集合（因为xml join中的匹配功能其实是很弱的）。
在merge join之前记录必须先排序。
placeholder 组件是往记录流中添加一个常量，这个常量在 add xml中通常不被设为属性，而是在xml join中用于放置需要被组装进去的xml元素。
以生成如下简单的xml文件为例：
<?xml version="1.0" encoding="UTF-8"?>
<document>
    <section name="foo">
    <p>
        Hello from section foo
    </p>
    </section>
    <section name="bar">
    <p>
        Hello from section bar
    </p>
    </section>
</document>
对应的kettle 转换为：

首先需要从excel文件中读取数据，excel文件中的内容为

利用读取到的内容生成xml元素，如下是add xml中的设置：

这一步主要生成了如下的xml元素：
<section name="foo">
    <p>
        Hello from section foo
    </p>
</section>
<section name="bar">
    <p>
        Hello from section bar
    </p>
  </section>
接下来要生成 <document>元素，因为该元素没有对应的数据，所以使用“生成记录”组件生成一条空记录用于与之前的xml元素进行xml join。它的功能有点类似与之前提到的placeholder，不同的是这个可以作为起始输入，而placeholder是一个转换步骤。

接着就是进行xml join了，source stream中的xml元素会被拼接到target stream的xml元素中。怎么拼接有join condition properties决定，它是使用xpath来定位要拼接的位置，例如//doc 就是把source stream的元素拼接到每个doc元素中。需要注意的是，由于这次xml join之后xml文件就生成好了，所以不能把omit xml header选上。

当然通过xpath也可以做复杂的条件join，如下是个例子：

可以通过xpath指定在所有target stream的area元素中如果area的属性STATIONID的值与source stream中STATIONID的值（这个值不一定要在source的xml元素中，但必须在source stream中，例如可以是一开始从excel读入的流中）相同，那么把source stream中的xml元素放到 orderlinecomments元素中。

这步之后生成的xml文件如下：
<?xml version="1.0" encoding="UTF-8"?>
<document>
<doc>
    <section name="foo">
    <p>
        Hello from section foo
    </p>
    </section>
    <section name="bar">
    <p>
        Hello from section bar
    </p>
    </section>
</doc>
</document>
和我们预期的多了<doc>和</doc>，这是我们使用js脚本进行替换：