weka使用教程1--ARFF文件生成和使用

weka的数据格式是ARFF

1 生成ARFF文件

以要不要去沙滩的数据集为例进行说明,该数据集有三列 第一列:天气  第二列:温度  第三列:要不要去沙滩

我们把这三列数据复制到 Notepad中,ARFF还需要其他的一些信息:

       a) 第1行,是关系名称,这个自己随便起,不过写的最好要有意义。

   b) 第2~3行是特征列表,其中第1列是特征说明,不可缺少,第2列是特征名称,第3列是特征类型或特征取值范围。

   c) @data(第5行)是数据域说明,在它下面的全是数据。其中每一行体表一条数据。

  将文件保存成ARF文件的形式

2 测试

(1)选择Explorer,open file选择上边生成的ARFF文件

(2)选择Classifier为NaiveBayes,Test options选择十次交叉验证,点击start

3. 十折交叉验证的概念

10-fold cross-validation 就是十折交叉验证,用来测试精度。是常用的精度测试方法.将数据集分成十分,轮流将其中9份做训练1份做测试,10次的结果的均值作为对算法精度的估计,一般还需要进行多次10倍交叉验证 求均值,例如10次10倍交叉验证,更精确一点。

  • 7
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值