一、读Access
概述
该操作符从Access 数据库读取一个数据集。
描述
这个操作符用JDBC-ODBC-Bridge从Microsoft Access数据库中读取数据集。
输入
输出
output:
参数
username: Access 数据库用户名。
password: Access 数据库密码。
define query: 指定是否应直接的定义数据库查询,通过一个文件或隐式的通过一个给定的表名。
query: 一个SQL查询。
query file: 包含SQL查询的文件。
table name: 应读取的Access 数据库中的单个表名。
database file: 应读的包含Access 数据库的mdb 文件。
二、读CSV
概述
该操作符能读 csv 文件。
描述
这个操作符可以读CSV文件,一个实例的所有值被写入一行,并被一个常量分隔符分开。在列分隔符参数中,分隔符可能被指定。默认将在每个逗号,分号,空白处分开。任意正则表达式不能作为
分隔符。空值和问号将被读取为缺省值。你能用双引号引用该值(包括列分隔符)。你能用一个反斜线,即“\”转义引用字符。
第一行用于作为默认的属性名称,使用第一行作为属性名参数进行控制。 通过读前几行并检查发生的值,这个操作符试着决定属性的一个合适的类型。如果所有的值是整数,该属性将成为整数,如
果出现实数,将成为实数类型。列包含的不能被解释为数字的值将是标称的,只要它们不匹配日期格式参数的日期和时间模式。如果它们这样做了,csv文件的这列将自动的被解析为日期,并根据属
性成为日期类型。
输入
输出
output:
参数
configure operator: 通过向导配置该操作符。
file name: 从该文件读取数据的文件名。
encoding: 用于读或写文件的文件名。
trim lines: 表示在列分裂执行之前是否修剪行(在开始和结束处删除空格)。如果TABs被用作为分隔
符,该选项可能会有问题。
skip comments: 表示是否使用注释字符。
comment characters: 以这些字符开始的行被忽略。
use first row as attribute names: 从文件读取数据名(假设属性名在文件的第一行)。
use quotes: 表示是否考虑引用。
quotes character: 引用字符。
escape character for quotes: 用于转义引用的字符。
column separators: 数据文件的列分隔符(正则表达式)。
parse numbers: 表示是否解析数据。
decimal character: 小数字符。
grouped digits: 稀疏分组数字。
grouping character: 分组字符。
date format: 日期值模式格式。
read not matching values as missings: 将与指定值类型不匹配的值视为缺失。
data set meta data information: 元数据信息。
attribute names already defined: 该参数描述是否由用户手工设置属性名,或由读者生成。(文件第一行的通用名)。
三、读Excel
概述
该操作符从Excel电子表格文件中读取一个实例集。
描述
这个操作符可以用来从Microsoft Excel电子表格中加载数据。这个操作符能够从Excel 95, 97, 2000, XP,和 2003中读取数据。用户必须定义工作薄中的哪个电子表格应该被用来作为数据表。该表必须有一个格式,以便每一行是一个实例,每一列代表一个属性。请注意,第一行可能被用于属性名称,它能被一个参数指明。
数据表能被放在图标的任何位置,并允许包含任意格式的指令,空行和空列。缺失数据值用空单元格或只包含“?”的单元格显示。
输入
输出
output: