使用libsvm中svm-scale的时候,遇到如下的小问题:
原始数据文件test的内容:
1 1:-1 2:-1 3:-1 4:1 5:-1 6:1 7:-1 8:1 9:-1
2 1:1 2:1 3:-1 4:1 5:-1 6:-1 7:1 8:1 9:-1
3 1:1 2:1 3:1 4:-1 5:1 6:-1 7:-1 8:-1 9:1
执行 svm-scale.exe test > test.scale 后:
3 1:-1 2:-1 3:-1 4:1 5:-1 6:1 7:-1 8:1 9:-1
2 1:1 2:1 3:-1 4:1 5:-1 6:-1 7:1 8:1 9:-1
3 1:1 2:1 3:1 4:-1 5:1 6:-1 7:-1 8:-1 9:1
为什么label变成3,2,3了?这个把类别都修改了,认为原始数据中的1,3是同一类数据吗?
问题原因:
文件要以asni格式存储。
用utf8就会出现上述问题,最后一个和第一个label永远是一样的。
参考
http://www.baisi.net/thread-2476407-1-1.html