YOLO v5获取目标的坐标位置，以及将crop融合到全黑背景中

我在记

已于 2023-03-22 23:02:32 修改

阅读量4k

点赞数 5

分类专栏： opencv yolo 文章标签： pytorch 深度学习 Powered by 金山文档

于 2023-03-22 22:58:57 首次发布

本文链接：https://blog.csdn.net/weixin_43761981/article/details/129721028

版权

opencv 同时被 2 个专栏收录

2 篇文章 0 订阅

订阅专栏

yolo

1 篇文章 0 订阅

订阅专栏

可能很多人不知道我这个标题后面这句话的含义，因为这个场景可能很多地方压根用不到，暂时不细说

我是上个月开始接触yolov5 v6.2版本做目标识别的，也没有什么深度学习和pytorch的概念，直接下载了源码然后开始搜操作的教程，一路走路超级艰难，但是现在对我自己的任务有一点小苗头了

言归正传，首先，获取坐标，我前期也看了很多大佬的教程，比如更改detect的代码，通过训练结果的xyxy数据来获取目标的准确坐标，效果有，但是和源码自带的crop的位置有所差异。（通过修改以下代码可以打开存储crop的开关：detect文件末尾的参数位置的--save crop，设置为True）

可以发现yolo保存的截图比我们下面代码方法的区域要大很多。

 parser.add_argument('--save-crop', action='store_true', default=True, help='save cropped prediction boxes')

查看源码，找到utils包里面的plots.py，里面记录了对img的处理，比如画框等等，对于crop的位置便是在这里的save_one_box中显示的，他首先获取一系列数据，然后通过crop等于XXXXXXX这第518行代码来得到位置，同时如果save为True便保存在exps下面的文件夹中。

这里我的做法是新写一个函数，然后直接复制save_one_box的全部内容，参数去掉filepath，利用x1，x2，y1，y2来返回坐标信息，同时返回截图。

再然后在下图中第二个红框下

if save_crop前，插入一个代码

便可以得到crop截图以及位置信息，后面我们可以对它这些信息进行打印，也可以进行其他的操作，比如我这里是进行了一个输出打印加上一个高斯映射操作

对于我后面的将crop融入到黑色蒙版中，则面向的对象可能比较少，但是我是其中之一，首先要建立和原图一样大的黑色蒙版。位置在detect.py中的加载完数据后的热身推理步骤里面，如下，这里我加了两个mask，im0s是我们的原图，而前面那个im是resize后的图像，因为传入网络的图像需要进行resize和转换tensor嘛