数据挖掘工具Weka之数据格式xls转化为ARFF格式

首先打开需要转化的文件,我这边是xls格式

然后另存为csv格式

然后在weka中将csv格式转化为arff格式的方法有三种,可以供大家自由选择。

方法一:

  • 进入“Exploer”模块
  • open file 找到我们刚才保存的csv文件,并type选择CSV

点击右上角的save

type选择arff ,保存到桌面就行了

 

 方法二:

  • 使用WEKA所带的命令行工具。

运行WEKA的主程序,在菜单中找到“Simple CLI”模块,它可提供命令行功能。

在新窗口的最下方(上方是不能写字的):输入框写上

java weka.core.converters.CSVLoader filename.csv > filename.arff

filename.csv写上csv刚才文件保存的绝对路径

filename.arff 写上合适的生成位置

然后回车执行就可以了

方法三:

在WEKA 3.5之后提供了一个“Arff Viewer”模块,我们可以用它打开一个CSV文件将进行浏览,然后另存为ARFF文件。

​​​

 同理找到保存的csv文件并打开

 另存,选择arff格式

 

上面介绍的是的xls格式转换为arff格式的方法,其他格式转化为arff格式的方法也类同。

注意:

当我们打开arff文件,可能会出现下面乱码的情况

是因为weka默认的字符集编码是Cp1252,如果导入的数据中有中文字符,就会显示为乱码。

解决方法:

  1. 打开weka安装目录下的RunWeka.ini文件,找到【fileEncoding=】这一行,将Cp1252编码改为需要的字符集编码,比如utf-8,cp936(简体中文),cp950(繁体中文)。

  2. 若我们有时遇到不能修改文件的状况,可以先把文件进行修改,之后保存到桌面,接着再复制粘贴替换到原始文件的目录路径下即可。

    2.重新打开weka软件。打开arff文件。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值