最近接到一项任务,把一套算法(用caffe实现)的依赖库尽可能减少。网上各种找资料,也没找到什么,无意间接触到了darknet这个开源框架,它有一个大优势就是依赖库少。我给它的简介如下:
darknet——深度学习开源框架之一。
它由纯C语言写成的。
它的优势:
代码依赖项少,只要cuda就行,甚至opencv都可以不需要,如果只在CPU平台下跑,那CUDA也不需要了。这样我们可以很容易就将代码移植到其他平台上,这一点在工程 项目中是非常大的优势。(本人也正是有此需求,才接触到这一开源框架。)
它的缺点:
1、实例少,教程少,代码说明也很少,学习不是很方便;
2、darknet 做微调很麻烦,因为要修改前面很多层的学习率;
没有用它做很多东西,目前只知道这么多。
我在想,能否将caffe下训练好的模型转换到darknet下测试?于是我开始试验,用caffe中的手写数字识别进行验证,平台:Linux16.04,CPU环境。
至于Linux安装、caffe安装、opencv安装,以及如何使用caffe、mnist库进行手写数字识别、darknet的安装等内容,在网上有很多的参考资料,我就不详细说明了。直接进入 正题(已经在caffe下训练好了模型lenet_iter_5000.caffemodel、lenet_iter_10000.caffemodel这两个文件:
Step 1 : 如何将caffe中的网络配置和模型参数传递给darknet框架?很幸运,我从这位大神的博客里发现了这个caffe model to darknet model(链接),按照他的步骤:只需要修改一下最后一个命令行参数即可:python caffe2darknet.py lenet_deploy.prototxt lenet_iter_10000.caffemodel lenet.cfg lenet-model.weights。
参数说明:
caffe2darknet.py——将caffe转成darknet的python文件,不多解释。
lenet_deploy.prototxt——此文件是网络配置描述性文件,需要自己根据lenet_train_test.prototxt编写,步骤可以参考这位大神(链接)。
lenet_iter_10000.caffemodel——caffe训练好的模型文件。
lenet.cfg(自己命名)——输出文件,后面darknet操作需要用到的,网络配置。
lenet-model.weights(自己命名)——输出文件,后面darknet操作需要用到的,模型参数。
可是,如果也不能太相信这个生成网络配置和权重文件,因为毕竟caffe和darknet是两个不同的框架,两者对于层的构造可能会有所不同。我最开始就是太相信这两个文件,执行完后面的操作仍然得不到理想的