当数据的属性数量非常大,并且较多属性值为0时,考虑将arff文件进行稀疏处理,来优化读入和减少存储
例如下图中数据存在大量的0,读入数据时读入大量无用数据,并且浪费了存储空间
以上图为例
最初的arff数据是这样写的
@relation example
@attribute A1 numeric
@attribute A2 numeric
@attribute A3 numeric
@attribute A4 numeric
<当数据的属性数量非常大,并且较多属性值为0时,考虑将arff文件进行稀疏处理,来优化读入和减少存储
例如下图中数据存在大量的0,读入数据时读入大量无用数据,并且浪费了存储空间
以上图为例
最初的arff数据是这样写的
@relation example
@attribute A1 numeric
@attribute A2 numeric
@attribute A3 numeric
@attribute A4 numeric
<