文章目录
- yolov5复现记录
- 步骤
- 遇到的问题及解决方法
- 问题1:Can't get attribute 'SPPF' on <module 'models.common' from 'XXX\yolov5-5.0\\models\\common.py'>
- 解决1:增加SPPF类
- 问题2 AttributeError: 'Upsample' object has no attribute 'recompute_scale_factor'
- 解决2,在`yolo.py`文件新增两行判断代码
- 问题3:RuntimeError: The size of tensor a (80) must match the size of tensor b (56) at non-singleton
- 解决3: 模型文件不匹配,手动下载v5.0的pt文件
- 问题4 用户警告
- 问题5:有的结果缺省框,或者识别的结果不尽人意
- 解决5:添加cudnn.benchmark = True,具体做法如下
yolov5复现记录
步骤
1 打开GitHub,选择分支
2 下载zip, 解压后用PyCharm打开后先放弃建立虚拟环境
3 在PyCharm中设置python解释器
4 打开终端运行命令,安装环境需要的包
# 以下命令要在对应的conda环境中运行
# 可以用命令 conda activate env_yx 来激活conda虚拟环境,'env_yx'是我的虚拟环境名
pip install -r requirements.txt
5 打开detect.py,直接右击运行
遇到的问题及解决方法
问题1:Can’t get attribute ‘SPPF’ on <module ‘models.common’ from ‘XXX\yolov5-5.0\models\common.py’>
解决1:增加SPPF类
去Tags6里面的model/common.py里面去找到这个SPPF的类,把它拷过来到你这个Tags5的model/common.py里面,这样你的代码就也有这个类了,还要引入一个warnings包就行了,如下所示,可以直接复制
import warnings
class SPPF(nn.Module):
# Spatial Pyramid Pooling - Fast (SPPF) layer for YOLOv5 by Glenn Jocher
def __init__(self, c1, c2, k=5): # equivalent to SPP(k=(5, 9, 13))
super().__init__()
c_ = c1 // 2 # hidden channels
self.cv1 = Conv(c1, c_, 1, 1)
self.cv2 = Conv(c_ * 4, c2, 1, 1)
self.m = nn.MaxPool2d(kernel_size=k, stride=1, padding=k // 2)
def forward(self, x):
x = self.cv1(x)
with warnings.catch_warnings():
warnings.simplefilter('ignore') # suppress torch 1.9.0 max_pool2d() warning
y1 = self.m(x)
y2 = self.m(y1)
return self.cv2(torch.cat([x, y1, y2, self.m(y2)], 1))
问题2 AttributeError: ‘Upsample’ object has no attribute ‘recompute_scale_factor’
解决2,在yolo.py
文件新增两行判断代码
注意:最好不要采取网上流传的修改torch
源码的方式
问题3:RuntimeError: The size of tensor a (80) must match the size of tensor b (56) at non-singleton
解决3: 模型文件不匹配,手动下载v5.0的pt文件
首先,问题原因是,我们这里运行detect.py
,默认下载的pt文件是v7.0的,不是我们需要的v5.0
于是,我们不如用v5.0替换v7.0后,直接打开官网https://github.com/ultralytics/yolov5/releases/download/v5.0/yolov5s.pt下载咯
注意,pt文件不是放在weights文件夹下,而是放在项目目录下
问题4 用户警告
意思就是,在以后得版本中,需要传递indexing参数。
首先,这只是个用户警告,不是错误,不用管它,依然可以运行。
再者,网上流传的解决方法是修改torch源码,我还是坚持不修改源码的原则。
所以,这个 警告
俺先置之不理。
问题5:有的结果缺省框,或者识别的结果不尽人意
比如,本IKUN在测试图片时,发现data/images/bus.jpg的识别结果为空?
解决5:添加cudnn.benchmark = True,具体做法如下
复制第50行,添加第53行,让detect不打开摄像头时也使cudnn.benchmark = True
注意:具体行数视自己的具体行数而定哈,俺用的是v5.0版本的code,你看你是不是跟俺的一样
如此以来,再次运行:
可以看到,检测效果变好很多