caffe提取特征用svm进行分类

最新推荐文章于 2024-07-22 22:11:15 发布

2014wzy

最新推荐文章于 2024-07-22 22:11:15 发布

阅读量6.9k

点赞数

分类专栏： caffe框架

caffe框架专栏收录该内容

62 篇文章 1 订阅

订阅专栏

caffe c++批量抽取特征的方法在[1]，但是该方法使用中有几个疑问：

1. 如何转换levelDB 格式为libsvm格式。

2. ./build/tools/extract_features mini-batch 是代表什么意思，和imagenet_val.prototxt中的batch_size的关系是什么？

本文主要解决如上两个问题，具体extract_features源代码还需要进一步分析。

第一个问题，

[plain]view plaincopy 
   
 ./build/tools/extract_features models/bvlc_reference_caffenet/bvlc_reference_caffenet.caffemodel examples/_temp/imagenet_val.prototxt fc7 examples/_temp/features 10  

其中，10 是mini-batch, 假设imagenet_val.prototxt的batches size是128，那么程序将抽取128 * 10个图片的特征。如果你有100张图片，你可以设置mini-batch = 1, batches size = 100.
如果你的image个数是1283，那么如上数值的设置会是的leveldb多出3个无用的feature，这个需要注意，我测试过好像是会重复之前的图片，具体需要研究源代码。

第二个问题，特征保存的格式为leveldb，如果需要用libsvm的格式访问特征，可以用python 进行转换，程序如下，这里感谢bean的程序[1]：

[python]view plaincopy 
   
 import numpy as np  
 import caffe  
 import sys  
 from caffe.proto import caffe_pb2  
   
 #parse argument  
 dbName = sys.argv[1]  
 featureFile = sys.argv[2]  
 output = open(featureFile, 'w')  

[python]view plaincopy 
   
 # open leveldb files  
 db = leveldb.LevelDB(dbName)  
   
 # get db iterator  
 it = db.RangeIter()  
 count = 0  
 for key,value in it:  
     # convert string to datum  
   
     datum = caffe_pb2.Datum.FromString(db.Get(key))  
   
     # convert datum to numpy string  
   
     arr = caffe.io.datum_to_array(datum)[0]  
   
     i = 0  
     tmpS = ''  
   
     # convert to svm format  
   
     for i in range(0, len(arr)):  
         tmpS += str(i+1) + ':' + str(arr[i].tolist()[0]) + ' '  
     #print tmpS  
     output.write(tmpS.strip() + "\n")  
     count+=1  
     print count  
 output.close()  

但是这个程序有个巨大的bug，db.RangeIter()返回的key 顺序是按照字母进行排序的，和levelDB的排序方式是不一样的。具体参见[3]:

The problem is most likely caused by re-ordering of training/test examples since the db.RangeIter()iterates over keys in alphabetical order while extract_features creates keys from index values without leading zeros (unlike convert_imageset). Hence, you get an order like 0, 1, 10, 100, ...

Parse the key value in python and put the extracted feature vector at that position.

在这里，我们也只能说fuck了。修改后代码如下：

[python]view plaincopy 
   
 # get db iterator  
 it = db.RangeIter()  
 features = {}  
 for key,value in it:  
     # convert string to datum  
     datum = caffe_pb2.Datum.FromString(value)  
     # convert datum to numpy string   
     arr = caffe.io.datum_to_array(datum)[0]  
     features[int(key)] = arr  
   
 #write to file, since the key in it is sorted by alpha_number default, while leveldb is sorted by number, we must sort the key again.  
 sort_features = collections.OrderedDict(sorted(features.items()))  
 for k, arr  in sort_features.iteritems():  
     if(k > imageCount - 1):  
         break  
     line = ""  
     for i in range(0, len(arr)):  
         line += str(i+1) + ':' + str(arr[i].tolist()[0]) + ' '  
     output.write(line.strip() + "\n")  
 output.close()