想必大家都看了上节入门里面使用的文件,weather.nominal.arff,文件格式为.arff
arff全称是Attribute-Relation File Format,翻译来应该是属性关联文件格式。
可以记住里面只有@代表元数据描述,用来描述关系和属性
剩下的就可以是记录数据,例如:
@relation weather.symbolic
@attribute outlook {sunny, overcast, rainy}
@attribute temperature {hot, mild, cool}
@attribute humidity {high, normal}
@attribute windy {TRUE, FALSE}
@attribute play {yes, no}
@data
sunny,hot,high,FALSE,no
sunny,hot,high,TRUE,no
overcast,hot,high,FALSE,yes
rainy,mild,high,FALSE,yes
rainy,cool,normal,FALSE,yes
rainy,cool,normal,TRUE,no
overcast,cool,normal,TRUE,yes
sunny,mild,high,FALSE,no
sunny,cool,normal,FALSE,yes
rainy,mild,normal,FALSE,yes
sunny,mild,normal,TRUE,yes
overcast,mild,high,TRUE,yes
overcast,hot,normal,FALSE,yes
rainy,mild,high,TRUE,no
可以这样理解,第一部分为关系名,第二部分为属性名,有几行属性,下面数据就有几列,第三部分为数据,每一行数据
可以理解为:今天下雨,温度高,湿度大,不刮风,不出去玩。
参考链接:
1,http://www.cnblogs.com/finallyliuyu/archive/2010/08/23/1806414.html