DataCleaner---11.2 Source section

本文档段落介绍了作业文件格式的Source section,包括数据存储引用、列定义和变量设置。作业使用名为'orderdb'的数据存储,列定义允许作业适应不同列结构,而变量部分展示了可参数化作业的概念,允许在运行时替换属性值。
摘要由CSDN通过智能技术生成

11.2 Source section

作业文件格式的源部分可能是手动编辑或查看的最有趣的部分。下面是一个示例源代码部分:

<source>
  <data-context ref="orderdb" />
  <columns>
    <column path="PUBLIC.EMPLOYEES.EMPLOYEENUMBER" id="col_0" type="INTEGER" />
    <column path="PUBLIC.EMPLOYEES.LASTNAME" id="col_1" type="VARCHAR" />
    <column path="PUBLIC.EMPLOYEES.FIRSTNAME" id="col_2" type="VARCHAR" />
    <column path="PUBLIC.EMPLOYEES.EXTENSION" id="col_3" type="VARCHAR" />
    <column path="PUBLIC.EMPLOYEES.EMAIL" id="col_4" type="VARCHAR" />
    <column path="PUBLIC.EMPLOYEES.OFFICECODE" id="col_5" type="VARCHAR" />
    <column path="PUBLIC.EMPLOYEES.REPORTSTO" id="col_6" type="INTEGER" />
    <column path="PUBLIC.EMPLOYEES.JOBTITLE" id="col_7" type="VARCHAR" />
  </columns>
  <variables>
    <variable id="employee type" value="Sales Rep" />
  </variables>
</source>

从这个来源部分,我们可以得出以下有趣的事实:

  • 该作业正在使用名为“orderdb”的数据存储。此数据存储是如何配置的,作业不知道,因为它是在配置中定义的。该作业可能用于多个类似的数据存储,只要它们的名称是“orderdb”。
  • 定义的列构成了作业将触发的源查询的基。为每一列分配一个人工ID,并提供关于其数据类型的提示。这些信息用于分离列或用新定义替换列。这意味着,如果您花了很长时间构建完美的作业,但希望将其应用于其他列,则可以在此处“只是”更改列定义并保留原始列ID。
  • 在这个源代码部分,我们还看到了一些变量。这是一个可选的小节,并不常见。变量是可以在运行时用新值替换的属性值。有关更多信息和示例,请参见“可参数化作业”一章。

点这儿返回DataCleaner文档主目录

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值