Dynamic Zoom-in Network 论文笔记

最新推荐文章于 2024-01-15 23:20:43 发布

MingSun95

最新推荐文章于 2024-01-15 23:20:43 发布

阅读量809

点赞数 1

分类专栏： CV 目标检测论文笔记文章标签：目标检测强化学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_18882399/article/details/89328635

版权

最最最喜欢的目标检测预处理思想，没有之一！！！
在这里插入图片描述

1.研究动机

（1）高清图像中小物体目标检测的特征丢失严重，想针对小物体的图片区域进行放大(zoom-in)也就是单独切割出来(crop)丢进目标检测器中进行探测。
（2）为了避免过分切割(不将大目标也切碎)。
于是利用DQN（deep Q learning）的思想进行最有切割策略的选择。

2.基本概念

Action：在该任务中动作是指将图片某个矩形块crop出来，也就是所谓的zoom-in丢入到目标检测器进行小目标的详细探测。由（x,y,w,h）表示。
State：编码了两部分信息，一部分是用来表示若这个区域被crop出去探测比原图探测提升的精度有多少（精度收益）；另一部分为了避免多次crop出同一个区域进行zoom-in探测，会把crop出去的区域的精度收益置为0。这是由一个AG map来进行记录，而这个AG map有一个R-net的回归网络进行拟合。
Cost-aware reward function：为了不切碎大目标以及节省时间，采用带有惩罚的cost function，同时考虑了计算消耗和精度提升的多少，达到有限计算力的前提下提升精度的目的。给定状态s和动作a，plk代表在原图（低清）下探测的score，phk代表crop之后的高清探测下的

最低0.47元/天解锁文章

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
5
评论
Dynamic Zoom-in Network 论文笔记

最最最喜欢的目标检测预处理思想，没有之一！！！1.研究动机（1）高清图像中小物体目标检测的特征丢失严重，想针对小物体的图片区域进行放大(zoom-in)也就是单独切割出来(crop)丢进目标检测器中进行探测。（2）为了避免过分切割(不将大目标也切碎)。于是利用DQN（deep Q learning）的思想进行最有切割策略的选择。2.基本概念Action：在该任务中动作是指将图片某个矩...
复制链接

扫一扫

专栏目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。