刚开始在weka中写代码,主要关注weka.core包下的核心类中的Attribute, Instance, Instances。
分类样本的集合以Instances的形式保存为全局变量,其中每个样本是一个Instance。每个分类样本又含有许多Attribute(属性,特征),每个Instance的一个Attribute对应一个变量值Value。
简单的说,样本集合Instances是一张大表,列方向是Instance,行方向是Attribute,表中存储的是某个Instance对应Attribute的Value。
Attribute, Instance, Instances 核心类中有许多方法,经常用到的主要是以下几个:
1. Attribute att :
att.index() int
返回这个att在Instance或Instances所有Attribute中的位置(下标)。
att.name() String
返回属性名字
att.numValues() int
返回属性可能取值的个数。
att.value()