RapidMiner 数据读写

这篇博客详细介绍了如何使用 RapidMiner 进行数据的读取和写入操作,包括读Access、CSV、Excel和XML文件,以及写Access、CSV、Excel和数据库的方法。此外,还涵盖了读数据库的注意事项和重命名、设置角色等高级操作。
摘要由CSDN通过智能技术生成

这里写图片描述

一、读Access
概述

该操作符从Access 数据库读取一个数据集。

描述

这个操作符用JDBC-ODBC-Bridge从Microsoft Access数据库中读取数据集。

输入
输出

output:

参数

username: Access 数据库用户名。
password: Access 数据库密码。
define query: 指定是否应直接的定义数据库查询,通过一个文件或隐式的通过一个给定的表名。
query: 一个SQL查询。
query file: 包含SQL查询的文件。
table name: 应读取的Access 数据库中的单个表名。
database file: 应读的包含Access 数据库的mdb 文件。

二、读CSV
概述

该操作符能读 csv 文件。

描述

这个操作符可以读CSV文件,一个实例的所有值被写入一行,并被一个常量分隔符分开。在列分隔符参数中,分隔符可能被指定。默认将在每个逗号,分号,空白处分开。任意正则表达式不能作为
分隔符。空值和问号将被读取为缺省值。你能用双引号引用该值(包括列分隔符)。你能用一个反斜线,即“\”转义引用字符。
第一行用于作为默认的属性名称,使用第一行作为属性名参数进行控制。 通过读前几行并检查发生的值,这个操作符试着决定属性的一个合适的类型。如果所有的值是整数,该属性将成为整数,如
果出现实数,将成为实数类型。列包含的不能被解释为数字的值将是标称的,只要它们不匹配日期格式参数的日期和时间模式。如果它们这样做了,csv文件的这列将自动的被解析为日期,并根据属
性成为日期类型。

输入
输出

output:

参数

configure operator: 通过向导配置该操作符。
file name: 从该文件读取数据的文件名。
encoding: 用于读或写文件的文件名。
trim lines: 表示在列分裂执行之前是否修剪行(在开始和结束处删除空格)。如果TABs被用作为分隔
符,该选项可能会有问题。
skip comments: 表示是否使用注释字符。
comment characters: 以这些字符开始的行被忽略。
use first row as attribute names: 从文件读取数据名(假设属性名在文件的第一行)。
use quotes: 表示是否考虑引用。
quotes character: 引用字符。
escape character for quotes: 用于转义引用的字符。
column separators: 数据文件的列分隔符(正则表达式)。
parse numbers: 表示是否解析数据。
decimal character: 小数字符。
grouped digits: 稀疏分组数字。
grouping character: 分组字符。
date format: 日期值模式格式。
read not matching values as missings: 将与指定值类型不匹配的值视为缺失。
data set meta data information: 元数据信息。
attribute names already defined: 该参数描述是否由用户手工设置属性名,或由读者生成。(文件第一行的通用名)。

三、读Excel
概述

该操作符从Excel电子表格文件中读取一个实例集。

描述

这个操作符可以用来从Microsoft Excel电子表格中加载数据。这个操作符能够从Excel 95, 97, 2000, XP,和 2003中读取数据。用户必须定义工作薄中的哪个电子表格应该被用来作为数据表。该表必须有一个格式,以便每一行是一个实例,每一列代表一个属性。请注意,第一行可能被用于属性名称,它能被一个参数指明。
数据表能被放在图标的任何位置,并允许包含任意格式的指令,空行和空列。缺失数据值用空单元格或只包含“?”的单元格显示。

输入
输出

output:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值