Caffe 中LMDB接口处理多标签（Multi-Label）数据

最新推荐文章于 2019-09-27 10:35:47 发布

展翅XP

最新推荐文章于 2019-09-27 10:35:47 发布

阅读量9.9k

点赞数

分类专栏：日常记录文章标签： caffe 深度学习多标签

本文链接：https://blog.csdn.net/zhzhanp/article/details/50726701

版权

本文介绍了如何在Caffe中处理多标签（Multi-Label）数据，特别是利用LMDB接口进行存储。通常，Caffe的图像转LMDB工具仅支持单标签，但通过结合Python的LMDB库和Caffe的Python接口，可以将图像数据和多标签分别存入两个LMDB文件。在prototxt文件中，通过两个data layer分别读取这两个LMDB，每个layer的top对应相应的内容，解决了大容量数据存储的问题。

摘要由CSDN通过智能技术生成

Caffe的数据接口主要有原始图像（ImageData）, HDF5, LMDB/LevelDB。由于Caffe自带的图像转LMDB接口只支持但label，对于多label的任务，往往需要使用HDF5。

然而，Caffe对于HDF5的数据，需要预先读取整个h5文件，这对于小数据的情况不成问题，而且一次性读到内存里还节省训练中的IO开销。可是对于数据量大的情况，内存可能放不下整个h5文件，则需要划分成几个小的h5文件。可这样的实现一方面不优雅，另一方面训练中需要不停地轮流读取h5文件。一种可能的解决方案是把图像数据放到lmdb，label数据放到h5文件，prototxt里面label和data分别来自两个data layer。可是个人觉得这样的实现也不好看，毕竟代码里面要做HDF5和LMDB的存储。

最近从网上看到一种更直接的方法，大致是结合Python的LMDB库和Caffe的Python 接口 caffe.io.array_to_datum，把图像数据和label,分别存储到两个lmdb文件。而对于存储好的lmdb，又怎样写prototxt里面的datalayer来读取呢？目前caffe的datalayer, 指明了LMDB作为backend的话，默认第一个top就是存储lmdb时datum的data，第二个top就是datum的label，在下面的代码里没有指定datum的label，因此，对于data和label的lmdb，分别写一个datalayer, 每个datalayer的第一个top就是对应lmdb里的内容了。而top的blob的名字是可以自己定义的。
代码如