DataCleaner---11.2 Source section

最新推荐文章于 2021-03-02 17:29:47 发布

lover_leo

最新推荐文章于 2021-03-02 17:29:47 发布

阅读量110

点赞数

分类专栏： DataCleaner 文章标签： java 运维大数据

本文链接：https://blog.csdn.net/weixin_43899418/article/details/113988364

版权

DataCleaner 专栏收录该内容

87 篇文章 3 订阅

订阅专栏

本文档段落介绍了作业文件格式的Source section，包括数据存储引用、列定义和变量设置。作业使用名为'orderdb'的数据存储，列定义允许作业适应不同列结构，而变量部分展示了可参数化作业的概念，允许在运行时替换属性值。

摘要由CSDN通过智能技术生成

11.2 Source section

作业文件格式的源部分可能是手动编辑或查看的最有趣的部分。下面是一个示例源代码部分：

<source>
  <data-context ref="orderdb" />
  <columns>
    <column path="PUBLIC.EMPLOYEES.EMPLOYEENUMBER" id="col_0" type="INTEGER" />
    <column path="PUBLIC.EMPLOYEES.LASTNAME" id="col_1" type="VARCHAR" />
    <column path="PUBLIC.EMPLOYEES.FIRSTNAME" id="col_2" type="VARCHAR" />
    <column path="PUBLIC.EMPLOYEES.EXTENSION" id="col_3" type="VARCHAR" />
    <column path="PUBLIC.EMPLOYEES.EMAIL" id="col_4" type="VARCHAR" />
    <column path="PUBLIC.EMPLOYEES.OFFICECODE" id="col_5" type="VARCHAR" />
    <column path="PUBLIC.EMPLOYEES.REPORTSTO" id="col_6" type="INTEGER" />
    <column path="PUBLIC.EMPLOYEES.JOBTITLE" id="col_7" type="VARCHAR" />
  </columns>
  <variables>
    <variable id="employee type" value="Sales Rep" />
  </variables>
</source>

从这个来源部分，我们可以得出以下有趣的事实：

该作业正在使用名为“orderdb”的数据存储。此数据存储是如何配置的，作业不知道，因为它是在配置中定义的。该作业可能用于多个类似的数据存储，只要它们的名称是“orderdb”。
定义的列构成了作业将触发的源查询的基。为每一列分配一个人工ID，并提供关于其数据类型的提示。这些信息用于分离列或用新定义替换列。这意味着，如果您花了很长时间构建完美的作业，但希望将其应用于其他列，则可以在此处“只是”更改列定义并保留原始列ID。
在这个源代码部分，我们还看到了一些变量。这是一个可选的小节，并不常见。变量是可以在运行时用新值替换的属性值。有关更多信息和示例，请参见“可参数化作业”一章。

点这儿返回DataCleaner文档主目录

lover_leo

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
DataCleaner---11.2 Source section

11.2 Source section作业文件格式的源部分可能是手动编辑或查看的最有趣的部分。下面是一个示例源代码部分：<source> <data-context ref="orderdb" /> <columns> <column path="PUBLIC.EMPLOYEES.EMPLOYEENUMBER" id="col_0" type="INTEGER" /> <column path="PUBLIC.EMPLOYEE
复制链接

扫一扫