思考: 根据 图片数据集 规律性 灵活设计 卷积结构

观察

针对不同问题所采集的图片数据集往往具有一定规律性:

  1. 如果为 平视拍摄(例如普通相机拍摄),那么人们往往倾向于把要关注的事物(如人脸)置于 画面中央
  2. 如果为 -45°俯视拍摄(例如监控摄像机拍摄),那么同类实例(如行人)往往呈现 近大远小

现有卷积结构设计

现有的卷积结构大多 一视同仁 地进行 视野感受:

这里写图片描述

缺陷

对整幅图片进行的 无差别卷积 意味着 注意力的平摊

思考

设计一种 有差别卷积

  1. 平视拍摄 时,可以对 画面中央 采用 小卷积核减少 细节信息 丢失
  2. -45°俯视拍摄 时,可以使用 近大远小 的不同卷积核,以 增加 远距离个体 的 识别精度

实现

为了避免重新设计框架接口引起的不必要麻烦,可采用 卷积结果 相覆盖 的思路。

平视图片

先用 大卷积核 对输入的整张 feature map 进行第一轮的常规卷积:
这里写图片描述

再用稍小的卷积核对 feature map 中心区域 进行 第二轮 更精细的 常规卷积。并用第二轮卷积结果 替换 第一轮卷积结果中心区域 的数据值:
这里写图片描述

由此即可实现 “差别对待” 的卷积操作。

-45°俯视图片

先用 大卷积核 对输入的整张 feature map 进行第一轮的常规卷积:
这里写图片描述

再用稍小的卷积核对 feature map 中上部区域 进行 第二轮 更精细的 常规卷积。并用第二轮卷积结果 替换 第一轮卷积结果中上部区域 的数据值:
这里写图片描述

再用更小的卷积核对 feature map 顶部区域 进行 第三轮 更更精细的 常规卷积。并用第三轮卷积结果 替换 之前卷积结果顶部区域 的数据值:
这里写图片描述

由此即可实现 “差别对待” 的卷积操作。

适用范围

该方法仅可适用于前几个网络层。

因为越往深去,每个网络层输入的 feature map 中,单个数值映射到原图像的感受野会越大,乃至大到覆盖大半个原图像。那么这个时候,有差别卷积操作 也就不可行了。

附加

当然,也可以在卷积核滑窗的stride(平移步长)上大做文章。比如在 feature map 的 不重要区域 增大stride减少 低性价比计算 的次数,从而 节省 GPU劳动力 。这里就不赘述了。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值