java weka 导入数据格式_Java编程实现WEKA数据文件的生成

WEKA(WaikatoEnvironmentforKnowledgeAnalysis)是Waikato大学研究的开放源码的免费使用的一款流行的数据挖掘平台,作为一个公开的数据挖掘工作平台,其中集成了大量能承担关联规则挖掘、分类、聚类等数据挖掘任务的机器学习算法,并提供了丰富的可视化功能%在数据挖掘中,数据输人是整个数据挖掘的准备阶段,数据的预处理是数据输人前的必不可少的环节。ARFF(At-…rtnbute-RelationFileFormat)文件是WEKA馱认的储存数据集,,_文件,它是一种ASCII文本文件。在实际的应用中,许多的原始数据采用的是Excel或数据库存放,以Excel转换为ARFF文件格式为例,通常的做法是Excel导出为CSV格式,再利用WEKA的数据预处理功能导人CSV文件’这种做法对于单个Excel文件且单个Sheet表方法可行,但对于批量的Excel文件或多个Sheet表的手动转换方式,显得过于繁琐。因此,对于WEKA数据文件的动态生成存在实际的应用需求,本文利用Java编程实现了WEKAARFF数据文件的生成。1ARFF数据格式描述每个ARFF文件就是一个数据集,相当于一个二维表格。列表头是数据集的各个属性(Attrbute),相当于统计学中的一个变量,或者数据库中的-个字段;除开表头的表格的各行是数据集的各实例(Instance),类似于统计学中的各个样本,或者数据库中的记录。ARFF文件有面定的数据格式,包括头信息和数据两个部分,头信息定义了表的名称和表的结构,数据部分以行为单位按表结构定义了数据集的各实例。在具体的ARFF的数据格式描述中提供了一套统一的符号集,其表示的含义如表1所示。表1常励ARFF数据格式的描述符号种辟桃11:111_J_物。"g义細名&@attribule紅__3@data实例数据的开始在表结构的定义中,属性具有唯一性,以行为单位进行书写,每一个属性都W@attribute语句开头,来定义其属性名

称和数据类型,属性定义的基本格式如下:@attribute属性名数据类型ARFF所支持的数据类型有:数值型(整型或实型)、标称型、字符串型、日期时间型等,数据类型的具体符号如表2

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值