❀YOLOv5学习❀对Focus的理解

夏天｜여름이다

已于 2022-04-05 21:49:59 修改

阅读量7.9k

点赞数 1

分类专栏： # - YOLO系列 - 文章标签：深度学习人工智能

于 2022-01-12 17:14:15 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44649780/article/details/122456021

版权

- YOLO系列 - 专栏收录该内容

12 篇文章

订阅专栏

focus模块的结构：

输入图像后进行分割，再进行连接后进入下一个模块。

图像是怎么进行分割的呢？拿3*4*4进行举例。

将 3×4×4 的输入通过隔行切片的操作变换为 12×2×2，Focus 操作可以在没有参数的情况下将输入维度进行下采样，并且尽可能保留了原有的图像信息。

对图片进行切片操作，具体操作是在一张图片中每隔一个像素拿到一个值，类似于邻近下采样，这样就拿到了四张图片，四张图片互补，长的差不多，但是没有信息丢失，这样一来，将W、H信息就集中到了通道空间，输入通道扩充了4倍，即拼接起来的图片相对于原先的RGB三通道模式变成了12个通道，最后将得到的新图片再经过卷积操作，最终得到了没有信息丢失情况下的二倍下采样特征图（Focus下采样的参数量略多于Conv下采样，但是有一定提升效果）。

在YOLOv5中的实现：

个人认为，增加通道，缩减wh的值，更加有利于后期计算。

看了很多博客和视频，大佬们没说，现在还是很困惑的点。

对Focus的疑问？

1：为什么横向和纵向都隔一个元素取样？是单纯地取样方法吗？

2：focus还有没有其他的功能？

参考博文：

1.yolov5种 focus的作用，下采样保持信息不丢失_AIchiNiurou的博客-CSDN博客_yolov5focus

2.深入浅出Yolo系列之Yolov5核心基础知识完整讲解 - 知乎 (zhihu.com)

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

夏天｜여름이다 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。