基于caffe框架复现yolov3目标检测

最新推荐文章于 2025-04-15 19:11:15 发布

Rooooooooc

最新推荐文章于 2025-04-15 19:11:15 发布

阅读量2.9w

点赞数 11

分类专栏： caffe yolov3 目标检测 jetson-tx2

本文链接：https://blog.csdn.net/Chen_yingpeng/article/details/80692018

版权

本文档详细介绍了如何在Caffe框架下复现YOLOv3目标检测模型，包括模型转换和环境搭建。作者指出，由于Caffe中缺少YOLOv3特有的层，如upsample，因此需要自定义这些层并重新编译Caffe。转换工具和自定义层代码已在GitHub上提供。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

网上有pytorch、tensorflow等框架实现的很多，但是使用caffe复现的几乎没有；或许是因为caffe框架逐渐没落了么？没办法，只要自己动手丰衣足食了！过程有点麻烦。。。。。。。。。。。。。。。。。

非常感谢大家的提问，最近很忙几乎没有回复，但是我把问题都总结了一下，我都更新到了github上，有需求的可以直接上github，还是老地址,可能回复不是很及时，还请见谅！

补充说明一下复现平台：Jetson-TX2、Ubuntu16.04 LTS

1 模型转换（模型已经上传百度云，在github上有链接，嫌麻烦的话，可以跳过该部分）

可以借助一个模型转换的工具：https://github.com/marvis/pytorch-caffe-darknet-convert；（需要安装pytorch，安装自行百度解决）

但是这个github上介绍的是基于yolo与yolov2的，有以下几点需要注意：

1）、这两个weights的存储方式与yolov3的存储方式有点不同；

2）、yolov3上有upsample层在之前的版本上没有；

因此针对这些不同点我重新写了一个darknet2caffe.py的文件

import sys
sys.path.append('/home/ss/caffe/python')
import caffe
import numpy as np
from collections import OrderedDict
from cfg import *
from prototxt import *

def darknet2caffe(cfgfile, weightfile, protofile, caffemodel):
    net_info = cfg2prototxt(cfgfile)
    save_prototxt(net_info , protofile, region=False)

    net = caffe.Net(protofile, caffe.TEST)
    params = net.params

    blocks = parse_cfg(cfgfile)

    #Open the weights file
    fp = open(weightfile, "rb")

    #The first 4 values are header information 
    # 1. Major version number
    # 2. Minor Version Number
    # 3. Subversion number 
    # 4. IMages seen 
    header = np.fromfile(fp, dtype = np.int32, count = 5)

    #fp = open(weightfile, 'rb')
    #header = np.fromfile(fp, count=5, dtype=np.int32)
    #header = np.ndarray(shape=(5,),dtype='int32',buffer=fp.read(20))
    #print(header)
    buf = np.fromfile(fp, dtype = np.float32)
    #print(buf)
    fp.close()

    layers = []
    layer_id = 1
    start = 0
    for block in blocks:
        if start >= buf.size:
            break

        if block['type'] == 'net':
            continue
        elif block['type'] == 'convolutional':
            batch_normalize = int(block['batch_normalize'])
            if block.has_key('name'):
                conv_layer_name = block['name']
                bn_layer_name = '%s-bn' % block['name']
                scale_layer_name = '%s-scale' % block['name']
            else:
                conv_layer_name = 'layer%d-conv' % layer_id
                bn_layer_name = 'layer%d-bn' % layer_id
                scale_layer_name = 'layer%d-scale' % layer_id

            if batch_normalize:
                start = load_conv_bn2caffe(buf, start, params[conv_layer_name], params[bn_layer_name], params[scale_layer_name])
            else:
                start = load_conv2caffe(buf, start, params[conv_layer_name])
            layer_id = layer_id+1
        elif block['type'] == 'connected':
            if block.has_key('name'):
                fc_layer_name = block['name']
            else:
                fc_layer_name = 'layer%d-fc' % layer_id
            start = load_fc2caffe(buf, start, params[fc_layer_name])
            layer_id = layer_id+1
        elif block['type'] == 'maxpool':
            layer_id = layer_id+1
        elif block['type'] == 'avgpool':
            layer_id = layer_id+1
        elif block['type'] == 'region':
            layer_id = layer_id + 1
        elif block['type'] == 'route':
            layer_id = layer_id + 1
        elif block['type'] == 'shortcut':
            layer_id = layer_id + 1
        elif block['type'] == 'softmax':
            layer_id = layer_id + 1
        elif block['type'] == 'cost':
            layer_id = layer_id + 1
	elif block['type'] == 'upsample':
	    layer_id = layer_id + 1
        else:
            print('unknow layer type %s ' % block['type'])
            layer_id = layer_id + 1
    print('save prototxt to %s' % pr

最低0.47元/天解锁文章