思考: 根据图片数据集规律性灵活设计卷积结构

最新推荐文章于 2019-04-11 16:17:43 发布

JNingWei

最新推荐文章于 2019-04-11 16:17:43 发布

阅读量509

点赞数 1

分类专栏： Idea与思考

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/JNingWei/article/details/78993147

版权

Idea与思考专栏收录该内容

8 篇文章 10 订阅

订阅专栏

观察

针对不同问题所采集的图片数据集往往具有一定规律性：

如果为 平视拍摄（例如普通相机拍摄），那么人们往往倾向于把要关注的事物（如人脸）置于 画面中央 。
如果为 -45°俯视拍摄（例如监控摄像机拍摄），那么同类实例（如行人）往往呈现 近大远小 。

现有卷积结构设计

现有的卷积结构大多 一视同仁 地进行视野感受：

这里写图片描述

缺陷

对整幅图片进行的 无差别卷积 意味着 注意力的平摊 。

思考

设计一种 有差别卷积：

平视拍摄 时，可以对 画面中央 采用 小卷积核 以 减少细节信息丢失 。
-45°俯视拍摄 时，可以使用 近大远小 的不同卷积核，以 增加远距离个体的识别精度 。

实现

为了避免重新设计框架接口引起的不必要麻烦，可采用 卷积结果相覆盖 的思路。

平视图片

先用 大卷积核 对输入的整张 feature map 进行第一轮的常规卷积：
这里写图片描述

再用稍小的卷积核对 feature map 中心区域进行 第二轮更精细的 常规卷积。并用第二轮卷积结果替换第一轮卷积结果中心区域 的数据值：
这里写图片描述

由此即可实现 “差别对待” 的卷积操作。

-45°俯视图片

先用 大卷积核 对输入的整张 feature map 进行第一轮的常规卷积：
这里写图片描述

再用稍小的卷积核对 feature map 中上部区域进行 第二轮更精细的 常规卷积。并用第二轮卷积结果替换第一轮卷积结果中上部区域 的数据值：
这里写图片描述

再用更小的卷积核对 feature map 顶部区域进行 第三轮更更精细的 常规卷积。并用第三轮卷积结果替换之前卷积结果顶部区域 的数据值：
这里写图片描述

由此即可实现 “差别对待” 的卷积操作。

适用范围

该方法仅可适用于前几个网络层。

因为越往深去，每个网络层输入的 feature map 中，单个数值映射到原图像的感受野会越大，乃至大到覆盖大半个原图像。那么这个时候，有差别卷积操作 也就不可行了。

附加

当然，也可以在卷积核滑窗的stride（平移步长）上大做文章。比如在 feature map 的不重要区域 增大stride 以 减少低性价比计算 的次数，从而 节省 GPU劳动力 。这里就不赘述了。

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
思考: 根据图片数据集规律性灵活设计卷积结构

观察针对不同问题所采集的图片数据集往往具有一定规律性：如果为平视拍摄（例如普通相机拍摄），那么人们往往倾向于把要关注的事物（如人脸）置于画面中央。如果为 -45°俯视拍摄（例如监控摄像机拍摄），那么同类实例（如行人）往往呈现近大远小。现有卷积结构设计现有的卷积结构大多一视同仁地进行视野感受：缺陷对整幅图片进行的无差别卷积意味着注意力的
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。